Suche nach dem optimalen Forest
In dieser Übung führst du eine Grid-Suche mit 3-facher Cross-Validation durch, um die optimalen Hyperparameter von rf zu finden. Zur Bewertung jedes Modells im Grid verwendest du die Metrik negative mean squared error.
Beachte: Da die Grid-Suche ein erschöpfendes Suchverfahren ist, kann das Trainieren des Modells viel Zeit in Anspruch nehmen. Hier instanzierst du nur das GridSearchCV-Objekt, ohne es an den Trainingssatz anzupassen. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Estimator mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Der ungetunte Random-Forests-Regressor rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, stehen in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
GridSearchCVaussklearn.model_selection.Instanziiere ein
GridSearchCV-Objekt mit 3-facher CV und verwende negative mean squared error als Scoring-Metrik.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)