Suche nach dem optimalen Wald
In dieser Übung führst du eine Rastersuche mit 3-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von rf
zu finden. Um jedes Modell im Raster zu bewerten, verwendest du die Metrik des negativen mittleren quadratischen Fehlers.
Da die Rastersuche ein erschöpfender Suchprozess ist, kann es sehr lange dauern, das Modell zu trainieren. Hier instanziierst du nur das GridSearchCV
Objekt, ohne es an das Trainingsset anzupassen. Wie im Video besprochen, kannst du ein solches Objekt ähnlich wie jeden scikit-learn-Schätzer mit der Methode .fit()
trainieren:
grid_object.fit(X_train, y_train)
Das ungetunte Random-Forests-Regressor-Modell rf
sowie das Wörterbuch params_rf
, das du in der vorherigen Übung definiert hast, sind in deinem Arbeitsbereich verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
GridSearchCV
vonsklearn.model_selection
.Erstelle ein
GridSearchCV
Objekt mit Hilfe des 3-fachen CV, indem du den negativen mittleren quadratischen Fehler als Bewertungsmaßstab verwendest.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)