RandomizedSearchCV によるハイパーパラメータのチューニング

GridSearchCV は、特に広いハイパーパラメータ空間を探索する場合、計算コストが高くなることがあります。そのような場合には、RandomizedSearchCV が有効です。これは、指定した確率分布から一定数のハイパーパラメータの組み合わせをランダムにテストする手法です。

diabetes_df から作成したトレーニングセットとテストセットは、X_train、X_test、y_train、y_test としてあらかじめ読み込まれています。目的変数は "diabetes" です。ロジスティック回帰モデルは logreg として、KFold 変数は kf として作成済みです。

ここでは、ハイパーパラメータの範囲を定義し、RandomizedSearchCV からインポートされた sklearn.model_selection を使って、最適なハイパーパラメータを探索します。