1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

N-gramy vyššího řádu pro analýzu sentimentu

Podobně jako v předchozím cvičení sestavíme klasifikátor, který dokáže rozpoznat, zda je recenze daného filmu pozitivní, nebo negativní. Tentokrát ale použijeme n-gramy až do n=2.

Trénovací recenze ve formátu n-gramů jsou dostupné jako X_train_ng, testovací recenze jako X_test_ng. Pro přístup k trénovacím a testovacím třídám sentimentu použij y_train a y_test.

Pokyny

100 XP
  • Vytvoř instanci MultinomialNB a pojmenuj ji clf_ng.
  • Natrénuj klasifikátor na datech X_train_ng a y_train.
  • Změř accuracy na X_test_ng a y_test pomocí metody score().