1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

연습 문제

スケーリングしたデータでのKNN

スケーリングしていない wine データセットでの正解率はまずまずでしたが、標準化を使うとどこまで改善できるか試してみましょう。今回も、knn モデルと、特徴量 X と目的変数 y はすでに用意されています。

지침

100 XP
  • StandardScaler() を作成し、scaler という変数に保存します。
  • データリークを起こさないよう注意して、学習用およびテスト用の特徴量をスケーリングします。
  • スケーリングした学習用データに knn モデルを適合させます。
  • テストセットの正解率を計算して、モデルの性能を評価します。