Suche nach dem optimalen Forest
In dieser Übung führst du eine Grid-Suche mit 3-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von rf zu finden. Zur Bewertung jedes Modells im Grid verwendest du die Metrik negative mean squared error.
Beachte: Da die Grid-Suche ein erschöpfendes Suchverfahren ist, kann das Trainieren des Modells viel Zeit in Anspruch nehmen. Hier instanzierst du nur das GridSearchCV-Objekt, ohne es auf den Trainingssatz zu fitten. Wie im Video besprochen, kannst du ein solches Objekt analog zu jedem scikit-learn-Estimator mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Das ungetunte Random-Forests-Regressionsmodell rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, stehen dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
GridSearchCVaussklearn.model_selection.Instanziiere ein
GridSearchCV-Objekt mit 3-facher Kreuzvalidierung und verwende den negativen mittleren quadratischen Fehler als Scoring-Metrik.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)