1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

Exercise

UFOデータセットをモデリングする(その2)

最後に、作成したテキストベクトル desc_tfidf を使ってモデルを構築します。filtered_words リストを用いてフィルタ済みのテキストベクトルを作りましょう。テキストから観測の type を予測できるかを試します。ここでは Naive Bayes モデルを使います。

Instrukcje

100 XP
  • インデックスに filtered_words のリストを渡して、desc_tfidf ベクトルをフィルタします。
  • filtered_text 特徴量と y を分割し、学習用とテスト用でクラス分布が等しくなるようにします。random_state は 42 を使用します。
  • nb モデルの .fit() を使って X_train と y_train に当てはめます。
  • nb モデルの .score() を X_test と y_test に対して出力します。