LoslegenKostenlos starten

Suche nach dem optimalen Forest

In dieser Übung führst du eine Grid-Suche mit 3-facher Cross-Validation durch, um die optimalen Hyperparameter von rf zu finden. Zur Bewertung jedes Modells im Grid verwendest du die Metrik negative mean squared error.

Beachte: Da die Grid-Suche ein erschöpfendes Suchverfahren ist, kann das Trainieren des Modells viel Zeit in Anspruch nehmen. Hier instanzierst du nur das GridSearchCV-Objekt, ohne es an den Trainingssatz anzupassen. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Estimator mit der Methode .fit() trainieren:

grid_object.fit(X_train, y_train)

Der ungetunte Random-Forests-Regressor rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, stehen in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere GridSearchCV aus sklearn.model_selection.

  • Instanziiere ein GridSearchCV-Objekt mit 3-facher CV und verwende negative mean squared error als Scoring-Metrik.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import GridSearchCV
____

# Instantiate grid_rf
grid_rf = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       verbose=1,
                       n_jobs=-1)
Code bearbeiten und ausführen