1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

n-gram と語彙サイズを指定した BOW

この演習では、Amazon の商品レビューである reviews データセットを使って、もう一度 bag-of-words を作成します。主なタスクは、語彙のサイズを制限し、トークン列の長さ(n-gram)を指定することです。

指示

100 XP
  • sklearn からベクトライザをインポートします。
  • ベクトライザを作成し、次のパラメータを指定してください:語彙サイズは 1000 に制限、バイグラムのみを含め、500 件を超えるドキュメントに出現する語は無視します。
  • ベクトライザを review 列に fit します。
  • BOW 表現から DataFrame を作成します。