1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

同じデータでのTfidfとBOW

この演習では、Amazon製品の reviews の review 列を、bag-of-words と tfidf の両方で変換します。

両方のベクトライザを作成し、特徴量の最大数のみを 100 に指定してください。変換後にそれぞれ DataFrame を作成し、各データの先頭5行を表示します。

語彙の最大特徴量数の指定には注意してください。語彙が大きすぎると、セッションが切断されることがあります。

指示

100 XP
  • BOW と Tfidf のベクトライザをインポートします。
  • review 列から BOW と Tfidf のベクトライザを作成して学習し、作成される特徴量数を100に制限します。
  • 変換後のベクトル表現から DataFrame を作成します。