Suche nach dem optimalen Forest
In dieser Übung führst du eine Grid-Suche mit 3-facher Cross-Validation durch, um die optimalen Hyperparameter von rf zu finden. Zur Bewertung jedes Modells im Grid verwendest du die Metrik negative mean squared error.
Beachte: Da die Grid-Suche ein erschöpfendes Suchverfahren ist, kann das Trainieren des Modells viel Zeit in Anspruch nehmen. Hier instanzierst du nur das GridSearchCV-Objekt, ohne es an den Trainingssatz anzupassen. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Estimator mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Der ungetunte Random-Forests-Regressor rf sowie das Wörterbuch params_rf, das du in der vorherigen Übung definiert hast, stehen in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>Übungsanweisungen
Importiere
GridSearchCVaussklearn.model_selection.Instanziiere ein
GridSearchCV-Objekt mit 3-facher CV und verwende negative mean squared error als Scoring-Metrik.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)