LoslegenKostenlos loslegen

Suche nach dem optimalen Baum

In dieser Übung führst du eine Rastersuche mit 5-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von dt zu finden. Da die Rastersuche ein umfassender Prozess ist, kann es sehr lange dauern, das Modell zu trainieren. Hier instanziierst du nur das GridSearchCV Objekt, ohne es an das Trainingsset anzupassen. Wie im Video besprochen, kannst du ein solches Objekt ähnlich wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:

grid_object.fit(X_train, y_train)

Ein unangepasster Klassifikationsbaum dt sowie das Wörterbuch params_dt, das du in der vorherigen Übung definiert hast, sind in deinem Arbeitsbereich verfügbar.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere GridSearchCV von sklearn.model_selection.

  • Instanziere ein GridSearchCV Objekt mit dem 5-fachen CV, indem du die Parameter einstellst:

    • estimator auf dt, param_grid auf params_dt und

    • scoring zu 'roc_auc'.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Code bearbeiten und ausführen