1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

N-gramy wyższego rzędu w analizie sentymentu

Podobnie jak w poprzednim ćwiczeniu, zbudujesz klasyfikator wykrywający, czy recenzja danego filmu jest pozytywna, czy negatywna. Tym razem jednak do zadania użyjesz n-gramów do n=2.

Recenzje treningowe w postaci n-gramów są dostępne jako X_train_ng. Odpowiadające im recenzje testowe znajdziesz w X_test_ng. Do klas sentymentu dla zbiorów treningowego i testowego służą odpowiednio y_train i y_test.

Instrukcje

100 XP
  • Utwórz instancję MultinomialNB i nazwij ją clf_ng.
  • Dopasuj klasyfikator do danych X_train_ng i y_train.
  • Zmierz accuracy na danych X_test_ng i y_test, korzystając z metody score().