LoslegenKostenlos loslegen

Die Grid-Search-Ergebnisse erkunden

Jetzt erkundest du die Eigenschaft cv_results_ des im Video definierten GridSearchCV-Objekts. Dabei handelt es sich um ein Dictionary, das wir in einen pandas-DataFrame einlesen können. Es enthält viele nützliche Informationen über die gerade durchgeführte Grid Search.

Zur Erinnerung die unterschiedlichen Spaltentypen in dieser Eigenschaft:

  • time_-Spalten
  • param_-Spalten (eine pro Hyperparameter) und die einzelne params-Spalte (mit allen Hyperparameter-Einstellungen)
  • eine train_score-Spalte für jeden CV-Fold, einschließlich der Spalten mean_train_score und std_train_score
  • eine test_score-Spalte für jeden CV-Fold, einschließlich der Spalten mean_test_score und std_test_score
  • eine rank_test_score-Spalte mit einer Zahl von 1 bis n (Anzahl der Iterationen), die die Zeilen basierend auf ihrem mean_test_score einordnet

Diese Übung ist Teil des Kurses

Hyperparameter-Tuning in Python

Kurs anzeigen

Anleitung zur Übung

  • Lies die Eigenschaft cv_results_ des GridSearchCV-Objekts grid_rf_class in einen DataFrame ein und gib ihn komplett aus, um ihn zu inspizieren.
  • Extrahiere und gib die einzelne Spalte aus, die ein Dictionary aller in jeder Iteration der Grid Search verwendeten Hyperparameter enthält.
  • Extrahiere und gib die Zeile aus, die den besten durchschnittlichen Test-Score hatte, indem du über die Spalte rank_test_score indizierst.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)

# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)

# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)
Code bearbeiten und ausführen