1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

Exercise

tf/idf ベクトルを用いたテキスト分類

volunteer データセットの title 列を tf/idf ベクトルにエンコードできたので、これらのベクトルを使って category_desc 列を予測します。

Instrukcje

100 XP
  • クラス分布が不均衡なので、text_tfidf ベクトルと目的変数 y を訓練用とテスト用に分割し、stratify パラメータを y に設定します。scikit-learn に適した形式にするため、tf/idf ベクトルに対して .toarray() メソッドを実行する必要がある点にご注意ください。
  • Naive Bayes モデル nb に X_train と y_train を学習させます。
  • テストデータの正解率を出力します。