1. Lära sig
  2. /
  3. Courses
  4. /
  5. scikit-learn で学ぶ Supervised Learning

Connected

exercise

RandomizedSearchCV によるハイパーパラメータチューニング

ご覧のとおり、GridSearchCV は、特に大きなハイパーパラメータ空間を探索する場合は計算コストが高くなります。そこで RandomizedSearchCV を使うと、指定した確率分布から固定回数だけハイパーパラメータの組み合わせを試せます。

diabetes_df から分割した学習用・テスト用データは、X_train、X_test、y_train、y_test として事前に読み込まれており、目的変数は "diabetes" です。ロジスティック回帰モデルは logreg として、KFold は kf として作成済みです。

ここでは、ハイパーパラメータの範囲を定義し、sklearn.model_selection からインポート済みの RandomizedSearchCV を使って、これらの候補から最適なハイパーパラメータを探索します。

Instruktioner

100 XP
  • params を作成し、penalty に "l1" と "l2" を指定し、C は 0.1 から 1.0 の間で 50 個の float 値の範囲にし、class_weight は "balanced" または 0:0.8, 1:0.2 を含む辞書のいずれかにします。
  • ランダムサーチの CV オブジェクトを作成し、モデルとパラメータを渡し、cv を kf に設定します。
  • logreg_cv を学習データにフィットさせます。
  • モデルの最適パラメータと精度スコアを出力します。