1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶNLPの特徴量エンジニアリング

Connected

演習

n-gramモデルの性能を比較する

テキストをさまざまなn-gram表現に変換して分類器に入力し、感情分析を行う方法を学びました。この演習では、前と同じ映画レビューに対して、2つのn-gramモデル(ユニグラムと、n=3までのn-gram)を使って感情分析を行います。

その後、3つの基準で性能を比較します。テストセットでの正解率、プログラムの実行時間、そしてn-gram表現を生成するときに作成される特徴量の数です。

指示1 / 2

undefined XP
  • 1

    ユニグラムを生成するように CountVectorizer オブジェクトを初期化してください。

  • 2

    n=3 までの n-gram を生成するように CountVectorizer オブジェクトを初期化してください。