Suche nach dem optimalen Wald
In dieser Übung führst du eine Rastersuche mit 3-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von rf zu finden. Um jedes Modell im Raster zu bewerten, verwendest du die Metrik des negativen mittleren quadratischen Fehlers.
Da die Rastersuche ein erschöpfender Suchprozess ist, kann es sehr lange dauern, das Modell zu trainieren. Hier instanziierst du nur das GridSearchCV Objekt, ohne es an das Trainingsset anzupassen. Wie im Video besprochen, kannst du ein solches Objekt ähnlich wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Das ungetunte Random-Forests-Regressor-Modell rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, sind in deinem Arbeitsbereich verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
GridSearchCVvonsklearn.model_selection.Erstelle ein
GridSearchCVObjekt mit Hilfe des 3-fachen CV, indem du den negativen mittleren quadratischen Fehler als Bewertungsmaßstab verwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)