Zoek naar het optimale bos
In deze oefening voer je een grid search uit met 3-voudige cross-validatie om de optimale hyperparameters van rf te vinden. Om elk model in het raster te beoordelen, gebruik je de metriek negative mean squared error.
Let op: omdat grid search een uitputtend zoekproces is, kan het veel tijd kosten om het model te trainen. Hier instantieer je alleen het GridSearchCV-object zonder het te fitten op de trainingsset. Zoals in de video besproken, kun je zo'n object trainen zoals elke scikit-learn-estimator met de methode .fit():
grid_object.fit(X_train, y_train)
De ongetunede random forests-regressormodel rf en de dictionary params_rf die je in de vorige oefening hebt gedefinieerd, zijn beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
Importeer
GridSearchCVuitsklearn.model_selection.Instantieer een
GridSearchCV-object met 3-voudige cross-validatie en gebruik negative mean squared error als scoringmetriek.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)