分類のための中心化とスケーリング

ここでは、スケーリングとモデル構築をパイプラインにまとめて、交差検証を行いましょう。

music_df データセットの特徴量をスケーリングするパイプラインを構築し、ロジスティック回帰モデルを使ってハイパーパラメータ C の値を変えながらグリッドサーチ交差検証を実施します。目的変数は "genre" で、ロックを 1、それ以外のジャンルを 0 とした2値変数です。

StandardScaler、LogisticRegression、GridSearchCV はあらかじめインポート済みです。