1. 학습
  2. /
  3. 강의
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

연습 문제

CountVectorizer を使った「フェイクニュース」モデルの学習と評価

次は、あなたが特定・抽出した特徴量を使って「フェイクニュース」モデルを学習させましょう。最初のこの演習では、CountVectorizer のデータを用いて Naive Bayes モデルを学習し、評価します。

学習用とテスト用のデータセットはすでに用意されており、count_vectorizer、count_train、count_test も計算済みです。

지침

100 XP
  • sklearn から metrics モジュールを、sklearn.naive_bayes から MultinomialNB をインポートします。
  • MultinomialNB の分類器をインスタンス化し、nb_classifier と名付けます。
  • 分類器を学習データにフィットさせます。
  • テストデータに対する予測ラベルを計算します。
  • 分類器の正解率を計算して出力します。
  • 混同行列を計算します。見やすくするため、キーワード引数 labels=['FAKE', 'REAL'] を指定します。