Suche nach dem optimalen Baum
In dieser Übung führst du eine Grid-Search mit 5-facher Cross-Validation durch, um die optimalen Hyperparameter von dt zu finden. Beachte, dass Grid-Search ein exhaustives Verfahren ist und das Trainieren des Modells daher viel Zeit in Anspruch nehmen kann. Hier wirst du nur das GridSearchCV-Objekt instanziieren, ohne es auf den Trainingssatz zu fitten. Wie im Video besprochen, kannst du ein solches Objekt wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Ein ungetunter Klassifikationsbaum dt sowie das Wörterbuch params_dt, das du in der vorherigen Übung definiert hast, stehen dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>Übungsanweisungen
Importiere
GridSearchCVaussklearn.model_selection.Instanziiere ein
GridSearchCV-Objekt mit 5-facher CV, indem du die Parameter setzt:estimatoraufdt,param_gridaufparams_dtundscoringauf'roc_auc'.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)