1. 学ぶ
  2. /
  3. コース
  4. /
  5. scikit-learn による教師あり学習

Connected

演習

RandomizedSearchCV によるハイパーパラメータのチューニング

GridSearchCV は、特に広いハイパーパラメータ空間を探索する場合、計算コストが高くなることがあります。そのような場合には、RandomizedSearchCV が有効です。これは、指定した確率分布から一定数のハイパーパラメータの組み合わせをランダムにテストする手法です。

diabetes_df から作成したトレーニングセットとテストセットは、X_train、X_test、y_train、y_test としてあらかじめ読み込まれています。目的変数は "diabetes" です。ロジスティック回帰モデルは logreg として、KFold 変数は kf として作成済みです。

ここでは、ハイパーパラメータの範囲を定義し、RandomizedSearchCV からインポートされた sklearn.model_selection を使って、最適なハイパーパラメータを探索します。

指示

100 XP
  • params を作成します。"l1" の値として "l2" と penalty を追加し、C には 50 から 0.1 の範囲で 1.0 個の浮動小数点値を設定します。また、class_weight には "balanced" または 0:0.8, 1:0.2 の辞書を指定します。
  • モデルとパラメータを渡し、cv に kf を設定して、Randomized Search CV オブジェクトを作成します。
  • logreg_cv をトレーニングデータに適合させます。
  • モデルの最適なパラメータと精度スコアを出力します。