1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

特徴選択でNaive Bayesを学習する

ここでは、第3章の最後で実行したNaive Bayesによるテキスト分類モデルを、前の演習で選んだ特徴量(volunteer データセットの title と category_desc 列)で再実行します。

指示

100 XP
  • filtered_text のテキストベクトルと y ラベル(category_desc のラベル)に対して train_test_split() を使い、クラス分布が不均衡なため、stratify パラメータには y を渡します。
  • nb のNaive Bayesモデルを X_train と y_train に適合させます。
  • nb のテストセット精度を計算します。