LoslegenKostenlos loslegen

Suche nach dem optimalen Wald

In dieser Übung führst du eine Rastersuche mit 3-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von rf zu finden. Um jedes Modell im Raster zu bewerten, verwendest du die Metrik des negativen mittleren quadratischen Fehlers.

Da die Rastersuche ein erschöpfender Suchprozess ist, kann es sehr lange dauern, das Modell zu trainieren. Hier instanziierst du nur das GridSearchCV Objekt, ohne es an das Trainingsset anzupassen. Wie im Video besprochen, kannst du ein solches Objekt ähnlich wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:

grid_object.fit(X_train, y_train)

Das ungetunte Random-Forests-Regressor-Modell rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, sind in deinem Arbeitsbereich verfügbar.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere GridSearchCV von sklearn.model_selection.

  • Erstelle ein GridSearchCV Objekt mit Hilfe des 3-fachen CV, indem du den negativen mittleren quadratischen Fehler als Bewertungsmaßstab verwendest.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import GridSearchCV
____

# Instantiate grid_rf
grid_rf = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       verbose=1,
                       n_jobs=-1)
Code bearbeiten und ausführen