1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

Przewidywanie wydźwięku recenzji filmowej

W poprzednim ćwiczeniu wygenerowano reprezentacje bag-of-words dla danych treningowych i testowych z recenzjami filmów. W tym ćwiczeniu wykorzystamy ten model do wytrenowania klasyfikatora Naive Bayes, który potrafi wykrywać wydźwięk recenzji filmowej i obliczać jej dokładność. Zwróć uwagę, że jest to problem klasyfikacji binarnej – model potrafi zaklasyfikować recenzję wyłącznie jako pozytywną (1) lub negatywną (0). Nie jest w stanie wykrywać recenzji neutralnych.

Dla przypomnienia: wektory BoW dla zbioru treningowego i testowego są dostępne odpowiednio jako X_train_bow i X_test_bow. Odpowiadające im etykiety są dostępne jako y_train i y_test. Oryginalny zbiór danych z recenzjami filmów jest dostępny jako df.

Instrukcje

100 XP
  • Utwórz obiekt klasy MultinomialNB i nadaj mu nazwę clf.
  • Dopasuj clf, używając X_train_bow i y_train.
  • Zmierz dokładność clf, używając X_test_bow i y_test.