1. Учиться
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶNLPの特徴量エンジニアリング

Connected

Exercise

映画レビューの感情を予測する

前の演習では、映画レビューの学習用データとテスト用データについて、Bag-of-Words 表現を作成しました。今回の演習では、この表現を使って Naive Bayes 分類器を学習し、映画レビューの感情を判定して、その精度を計算します。これは二値分類問題なので、モデルはレビューをポジティブ(1)かネガティブ(0)のどちらかにしか分類できません。中立的なレビューは判定できない点に注意してください。

復習として、学習用とテスト用の BoW ベクトルはそれぞれ X_train_bow と X_test_bow に、対応するラベルは y_train と y_test に用意されています。参考までに、元の映画レビューのデータセットは df として利用できます。

Инструкции

100 XP
  • MultinomialNB のオブジェクトをインスタンス化し、clf という名前を付けてください。
  • X_train_bow と y_train を使って clf を学習(fit)させてください。
  • X_test_bow と y_test を使って clf の精度を測定してください。