1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

Předpovídání sentimentu filmové recenze

V předchozím cvičení jsi vytvořil/a bag-of-words reprezentace pro trénovací a testovací data filmových recenzí. V tomto cvičení pomocí tohoto modelu natrénujeme klasifikátor Naive Bayes, který dokáže rozpoznat sentiment filmové recenze a vypočítat jeho přesnost. Protože se jedná o binární klasifikaci, model dokáže recenzi zařadit pouze jako pozitivní (1) nebo negativní (0) – neutrální recenze rozpoznat neumí.

Pro připomenutí: trénovací a testovací BoW vektory jsou dostupné jako X_train_bow a X_test_bow. Odpovídající štítky jsou dostupné jako y_train a y_test. Původní dataset filmových recenzí je k dispozici jako df.

Pokyny

100 XP
  • Vytvoř instanci objektu MultinomialNB a pojmenuj ji clf.
  • Natrénuj clf pomocí X_train_bow a y_train.
  • Změř přesnost clf pomocí X_test_bow a y_test.