1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

UFOデータセットでモデリング(その1)

この演習では、UFOの目撃がどの国で起きたかを予測するために、k-nearest neighbor モデルを作成します。X データセットには、対数正規化した秒数の列、ワンホットエンコードした type の各列、さらに目撃が起きた月と年が含まれています。y ラベルはエンコード済みの国の列で、1 は "us"、0 は "ca" を表します。

指示

100 XP
  • X セットの .columns を出力します。
  • 訓練用とテスト用でラベルのクラス分布が同じになるように X と y を分割し、random_state は 42 にします。
  • 訓練データに knn を適合させます。
  • knn モデルのテスト精度を出力します。