1. Învăţa
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

exercise

ステップ2:ベクトライザを作成する

この演習では、reviewsデータセットのreview列に対してTfIDf変換を作成します。n-gram、ストップワード、トークンのパターン、語彙のサイズの各引数を指定してください。

これは、レビューの感情を予測する分類器を学習させる直前の最後のステップです。

最大特徴量数を適切に設定してください。語彙サイズが大きすぎると、セッションが切断される可能性があります。

Instrucţiuni

100 XP
  • Tfidfベクトライザと英語のデフォルトのストップワード一覧をインポートします。
  • 次の引数をこの順序で指定して、Tfidfベクトライザを作成します:ストップワードには英語のデフォルト一覧を使用する;n-gramはユニグラムとバイグラムを使用する;最大特徴量数は200にする;指定されたパターンで単語のみを抽出する。
  • 作成したTfidfベクトライザを使ってDataFrameを作成します。