Suche nach dem optimalen Baum
In dieser Übung führst du eine Rastersuche mit 5-facher Kreuzvalidierung durch, um die optimalen Hyperparameter von dt zu finden. Da die Rastersuche ein umfassender Prozess ist, kann es sehr lange dauern, das Modell zu trainieren. Hier instanziierst du nur das GridSearchCV Objekt, ohne es an das Trainingsset anzupassen. Wie im Video besprochen, kannst du ein solches Objekt ähnlich wie jeden scikit-learn-Schätzer mit der Methode .fit() trainieren:
grid_object.fit(X_train, y_train)
Ein unangepasster Klassifikationsbaum dt sowie das Wörterbuch params_dt, das du in der vorherigen Übung definiert hast, sind in deinem Arbeitsbereich verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Importiere
GridSearchCVvonsklearn.model_selection.Instanziere ein
GridSearchCVObjekt mit dem 5-fachen CV, indem du die Parameter einstellst:estimatoraufdt,param_gridaufparams_dtundscoringzu'roc_auc'.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)