1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

正規化なしでモデリングする

まず、標準化などの前処理を行わずにデータをモデリングすると、モデルの精度にどのような影響が出るかを見てみましょう。

ここでは、wine データセットの一部を使います。ある列である Proline は、他の列と比べて分散が非常に大きくなっています。これは、次のセクションで学ぶ対数正規化のような手法が有効に働く典型例です。

scikit-learn のモデル学習プロセスは、ここまでで十分馴染みがあるはずなので、詳細な説明は省きます。すでに k-nearest neighbors モデル(knn)が用意されており、学習と評価に使う X と y もあります。

指示

100 XP
  • X と y を学習用とテスト用に分割し、どちらのセットでもクラスラベルの分布が同程度になるようにします。
  • 学習用の特徴量とラベルを使って knn モデルを学習します。
  • .score() メソッドを使って knn モデルのテストセット正解率を表示します。