1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

BOW でトークン列の長さを指定する

動画で見たように、n-gram と呼ばれるトークンの長さを変えることで、文脈をより的確に捉えられる場合があります。これはとても重要です。

この演習では、Amazon の商品レビューのサンプルを扱います。review 列を使って BOW の語彙を作成し、トークン列の長さを指定してください。

指示

100 XP
  • ベクトライザを作成し、トークン列の長さがユニグラムとバイグラムになるように指定します。
  • ベクトライザを fit します。
  • fit 済みベクトライザで transform します。
  • DataFrame では、列名を正しく指定してください。