LoslegenKostenlos starten

Suche nach dem optimalen Baum

In dieser Übung führst du eine Grid-Search mit 5-facher Cross-Validation durch, um die optimalen Hyperparameter von dt zu finden. Beachte, dass Grid-Search ein exhaustives Verfahren ist und das Trainieren des Modells daher viel Zeit in Anspruch nehmen kann. Hier wirst du nur das GridSearchCV-Objekt instanziieren, ohne es auf den Trainingssatz zu fitten. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:

grid_object.fit(X_train, y_train)

Ein ungetunter Klassifikationsbaum dt sowie das Wörterbuch params_dt, das du in der vorherigen Übung definiert hast, stehen dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere GridSearchCV aus sklearn.model_selection.

  • Instanziiere ein GridSearchCV-Objekt mit 5-facher CV, indem du die Parameter setzt:

    • estimator auf dt, param_grid auf params_dt und

    • scoring auf 'roc_auc'.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Code bearbeiten und ausführen