1. Learn
  2. /
  3. Courses
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

Exercise

グリッドサーチ

ハイパーパラメータチューニングは、sklearn を使ってさまざまな入力パラメータを指定して行えます。各パラメータは numpy の関数で表現できます。param_grid で指定したすべてのハイパーパラメータの組み合わせを総当たりで探索する方法が、グリッドサーチです。この演習では、ROC 曲線の AUC を評価指標として、サンプルのランダムフォレスト分類器のハイパーパラメータをグリッドサーチで探索します。

X_train、y_train、X_test、y_test はワークスペースに用意されています。pandas は pd、numpy は np、sklearn もインポート済みです。さらに、sklearn.model_selection から GridSearchCV() が利用できます。

Instructions

100 XP
  • n_estimators と max_depth の各ハイパーパラメータについて、値のリストを作成します。
  • ランダムフォレスト分類器を作成します。
  • すべてのハイパーパラメータの組み合わせを反復するグリッドサーチを設定します。
  • .best_score_ を使って最良の AUC スコアを、.best_estimator_ を使ってそのスコアを達成した最良の推定器を出力します。