1. Learn
  2. /
  3. Courses
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

Exercise

TfidfVectorizer を使った「フェイクニュース」モデルの学習と評価

CountVectorizer を使ってモデルを評価できたので、同じ評価を TfidfVectorizer とナイーブベイズモデルで行います。

学習用・テスト用データセットはすでに作成済みで、tfidf_vectorizer、tfidf_train、tfidf_test も計算済みです。さらに、MultinomialNB と metrics はそれぞれ sklearn.naive_bayes と sklearn からインポート済みです。

Instructions

100 XP
  • MultinomialNB 分類器を作成し、nb_classifier という名前でインスタンス化します。
  • 分類器を学習データに適合させます。
  • テストデータに対する予測ラベルを計算します。
  • 分類器の正解率を計算して表示します。
  • 混同行列を計算します。前の演習と同様に、キーワード引数 labels=['FAKE', 'REAL'] を指定して、読みやすい混同行列を得てください。