1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

商品レビューでのBOW

小さなデータセットでBOWを練習しました。次は、Amazonの商品レビューのサンプルに適用してみましょう。データは reviews としてインポート済みです。2列あり、1つ目は score で、レビューがネガティブなら 0、ポジティブなら 1 です。2つ目は review で、顧客が書いたレビュー本文が入っています。IPython Shellで自由にデータを確認してかまいません。

あなたのタスクは、review 列を使ってBOWの語彙を作成することです。

ベクトライザに対して .get_feature_names() メソッドを呼ぶと、語彙要素の一覧を取得できることを思い出してください。

指示

100 XP
  • 最大特徴量数を指定して CountVectorizer オブジェクトを作成します。
  • ベクトライザをfitします。
  • fitしたベクトライザでtransformします。
  • 疎行列を密な配列に変換してDataFrameを作成し、列名を正しく指定します。