1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

演習

分類のためのセンタリングとスケーリング

ここでは、スケーリングとモデル構築をパイプラインでまとめ、クロスバリデーションを行います。

あなたのタスクは、music_df データセットの特徴量をスケーリングし、ロジスティック回帰モデルのハイパーパラメータ C の値を変えながらグリッドサーチ・クロスバリデーションを実行するパイプラインを構築することです。目的変数は "genre" で、ロックを 1、それ以外のジャンルを 0 の二値で表します。

StandardScaler、LogisticRegression、GridSearchCV はすでにインポートされています。

指示

100 XP
  • パイプラインのステップを作成します:"scaler" という名前の StandardScaler() オブジェクトと、"logreg" という名前のロジスティック回帰モデル。
  • パイプライン内のロジスティック回帰モデルのハイパーパラメータ C について、0.001 から 1.0 までの範囲を等間隔に20個に分けた浮動小数を探索するように、parameters を作成します。
  • グリッドサーチオブジェクトをインスタンス化します。
  • グリッドサーチオブジェクトを学習データにフィットさせます。