正規化なしでモデリングする

まず、標準化などの前処理を行わずにデータをモデリングすると、モデルの精度にどのような影響が出るかを見てみましょう。

ここでは、wine データセットの一部を使います。ある列である Proline は、他の列と比べて分散が非常に大きくなっています。これは、次のセクションで学ぶ対数正規化のような手法が有効に働く典型例です。

scikit-learn のモデル学習プロセスは、ここまでで十分馴染みがあるはずなので、詳細な説明は省きます。すでに k-nearest neighbors モデル（knn）が用意されており、学習と評価に使う X と y もあります。