Zoek naar de optimale boom
In deze oefening voer je een grid search uit met 5-fold cross-validatie om de optimale hyperparameters van dt te vinden. Omdat grid search een uitputtend proces is, kan het lang duren om het model te trainen. Hier instantieer je alleen het GridSearchCV-object zonder het te fitten op de trainingsset. Zoals in de video besproken, kun je zo'n object trainen zoals elke scikit-learn-estimator met de .fit()-methode:
grid_object.fit(X_train, y_train)
Een niet-afgestelde classificatieboom dt en de dictionary params_dt die je in de vorige oefening hebt gedefinieerd, zijn beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
Importeer
GridSearchCVuitsklearn.model_selection.Instantieer een
GridSearchCV-object met 5-fold CV door de parameters in te stellen:estimatoropdt,param_gridopparams_dtenscoringop'roc_auc'.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)