LoslegenKostenlos loslegen

Suche nach dem optimalen Baum

In dieser Übung führst du eine Grid-Suche mit 5-facher Cross-Validation durch, um die optimalen Hyperparameter von dt zu finden. Beachte, dass die Grid-Suche ein erschöpfendes Verfahren ist und das Training des Modells daher viel Zeit in Anspruch nehmen kann. Hier wirst du nur das GridSearchCV-Objekt instanziieren, ohne es auf den Trainingssatz zu fitten. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Estimator mit der Methode .fit() trainieren:

grid_object.fit(X_train, y_train)

Ein ungetunter Klassifikationsbaum dt sowie das Wörterbuch params_dt, das du in der vorherigen Übung definiert hast, stehen dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere GridSearchCV aus sklearn.model_selection.

  • Instanziiere ein GridSearchCV-Objekt mit 5-facher CV, indem du die Parameter setzt:

    • estimator auf dt, param_grid auf params_dt und

    • scoring auf 'roc_auc'.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Code bearbeiten und ausführen