1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in Python

Connected

cvičení

Hledání optimálního stromu

V tomto cvičení použiješ grid search s 5-násobnou křížovou validací k nalezení optimálních hyperparametrů modelu dt. Měj na paměti, že grid search je vyčerpávající proces a trénování modelu může trvat delší dobu. Tady se zaměříš pouze na vytvoření objektu GridSearchCV bez jeho trénování na trénovací sadě. Jak bylo ukázáno ve videu, takový objekt lze trénovat stejně jako jakýkoli estimátor ze scikit-learn pomocí metody .fit():

grid_object.fit(X_train, y_train)

V tvém pracovním prostoru je k dispozici neoptimalizovaný klasifikační strom dt a slovník params_dt, který jsi definoval/a v předchozím cvičení.

Pokyny

100 XP
  • Importuj GridSearchCV z sklearn.model_selection.

  • Vytvoř objekt GridSearchCV s 5-násobnou křížovou validací nastavením těchto parametrů:

    • estimator na dt, param_grid na params_dt a

    • scoring na 'roc_auc'.