ランダムサーチ

# Call GridSearchCV
grid_search = GridSearchCV(clf, param_grid)

# Fit the model
grid_search.fit(X, y)

前の演習のこのコードでは、最初の1行はすぐに終わる一方、.fit() の呼び出しは数秒かかったことにお気づきかもしれません。

これは、.fit() が実際にグリッドサーチを実行する処理だからです。今回の例では、非常に多くの組み合わせがあるグリッドを探索していました。ハイパーパラメータのグリッドが大きくなるほど、グリッドサーチは遅くなります。これを解決するために、すべての組み合わせを試す代わりに、グリッド上をランダムに飛び回って別の組み合わせを試す方法があります。最適な組み合わせを見逃す可能性はわずかにありますが、処理時間を大幅に節約でき、同じ時間でより多くのハイパーパラメータをチューニングできるようになります。

scikit-learn では、RandomizedSearchCV を使ってこれを実現できます。GridSearchCV と同じ API を持ちますが、特定の値の列挙ではなく、サンプリング元となるパラメータの分布を指定する点が異なります。さっそく試してみましょう。パラメータ分布は用意済みで、clf というランダムフォレスト分類器も用意されています。

sklearn.model_selection から RandomizedSearchCV をインポートします。

अभ्यास

ランダムサーチ

निर्देश 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश 1/3

अभ्यास