学ぶ

/

コース

/

Pythonで学ぶMachine Learningの前処理

Connected

演習

特徴選択でNaive Bayesを学習する

ここでは、第3章の最後で実行したNaive Bayesによるテキスト分類モデルを、前の演習で選んだ特徴量（volunteer データセットの title と category_desc 列）で再実行します。

指示

100 XP

filtered_text のテキストベクトルと y ラベル（category_desc のラベル）に対して train_test_split() を使い、クラス分布が不均衡なため、stratify パラメータには y を渡します。
nb のNaive Bayesモデルを X_train と y_train に適合させます。
nb のテストセット精度を計算します。