GridSearchCV mit Scikit Learn
Das Modul GridSearchCV aus Scikit Learn bietet viele nützliche Funktionen, um eine Grid Search effizient durchzuführen. Jetzt setzt du dein Wissen um, indem du ein GridSearchCV-Objekt mit bestimmten Parametern erstellst.
Die gewünschten Optionen sind:
- Ein Random-Forest-Estimator mit dem Split-Kriterium 'entropy'
- 5-fache Kreuzvalidierung
- Die Hyperparameter
max_depth(2, 4, 8, 15) undmax_features('auto' vs. 'sqrt') - Verwende
roc_auc, um die Modelle zu bewerten - Nutze 4 Kerne für parallele Verarbeitung
- Stelle sicher, dass du das beste Modell erneut anpasst (refit) und Trainingsscores zurückgibst
Dir stehen die Datensätze X_train, X_test, y_train und y_test zur Verfügung.
Diese Übung ist Teil des Kurses
Hyperparameter-Tuning in Python
Anleitung zur Übung
- Erstelle einen Random-Forest-Estimator wie oben beschrieben.
- Erstelle ein Parameter-Grid wie oben beschrieben.
- Erstelle ein
GridSearchCV-Objekt wie oben beschrieben und nutze dafür die beiden Elemente aus den vorherigen beiden Schritten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)