1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

分類のための中心化とスケーリング

ここでは、スケーリングとモデル構築をパイプラインにまとめて、交差検証を行いましょう。

music_df データセットの特徴量をスケーリングするパイプラインを構築し、ロジスティック回帰モデルを使ってハイパーパラメータ C の値を変えながらグリッドサーチ交差検証を実施します。目的変数は "genre" で、ロックを 1、それ以外のジャンルを 0 とした2値変数です。

StandardScaler、LogisticRegression、GridSearchCV はあらかじめインポート済みです。

指示

100 XP
  • パイプラインのステップを構築します。StandardScaler() オブジェクトを "scaler" という名前で、ロジスティック回帰モデルを "logreg" という名前で定義してください。
  • parameters を作成します。パイプライン内のロジスティック回帰モデルのハイパーパラメータ 0.001 に対して、1.0 から C の範囲で等間隔に並んだ浮動小数点数を20個探索するよう設定してください。
  • グリッドサーチオブジェクトをインスタンス化してください。
  • グリッドサーチオブジェクトを訓練データに適合させてください。