1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ木ベースのMachine Learning

Connected

演習

最適なフォレストを探す

この演習では、3 分割の交差検証を用いたグリッドサーチで、rf の最適なハイパーパラメータを探します。グリッド内の各モデルの評価には、negative mean squared error 指標を使用します。

グリッドサーチは総当たりで探索するため、モデルの学習に時間がかかる点に注意してください。ここでは、GridSearchCV オブジェクトを作成するだけで、トレーニング集合への適合は行いません。動画で説明したとおり、このオブジェクトは他の scikit-learn の推定器と同様に .fit() メソッドで学習できます。

grid_object.fit(X_train, y_train)

未調整の Random Forests 回帰モデル rf と、前の演習で定義した辞書 params_rf は、すでにワークスペースに用意されています。

指示

100 XP
  • sklearn.model_selection から GridSearchCV をインポートします。

  • スコアリングに negative mean squared error を用い、3 分割の CV を使う GridSearchCV オブジェクトを作成します。