LoslegenKostenlos loslegen

GridSearchCV mit Scikit Learn

Das Modul GridSearchCV aus Scikit Learn bietet viele nützliche Funktionen, um eine Grid Search effizient durchzuführen. Jetzt setzt du dein Wissen um, indem du ein GridSearchCV-Objekt mit bestimmten Parametern erstellst.

Die gewünschten Optionen sind:

  • Ein Random-Forest-Estimator mit dem Split-Kriterium 'entropy'
  • 5-fache Kreuzvalidierung
  • Die Hyperparameter max_depth (2, 4, 8, 15) und max_features ('auto' vs. 'sqrt')
  • Verwende roc_auc, um die Modelle zu bewerten
  • Nutze 4 Kerne für parallele Verarbeitung
  • Stelle sicher, dass du das beste Modell erneut anpasst (refit) und Trainingsscores zurückgibst

Dir stehen die Datensätze X_train, X_test, y_train und y_test zur Verfügung.

Diese Übung ist Teil des Kurses

Hyperparameter-Tuning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen Random-Forest-Estimator wie oben beschrieben.
  • Erstelle ein Parameter-Grid wie oben beschrieben.
  • Erstelle ein GridSearchCV-Objekt wie oben beschrieben und nutze dafür die beiden Elemente aus den vorherigen beiden Schritten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Code bearbeiten und ausführen