Die Grid-Search-Ergebnisse erkunden
Jetzt erkundest du die Eigenschaft cv_results_ des im Video definierten GridSearchCV-Objekts. Dabei handelt es sich um ein Dictionary, das wir in einen pandas-DataFrame einlesen können. Es enthält viele nützliche Informationen über die gerade durchgeführte Grid Search.
Zur Erinnerung die unterschiedlichen Spaltentypen in dieser Eigenschaft:
time_-Spaltenparam_-Spalten (eine pro Hyperparameter) und die einzelneparams-Spalte (mit allen Hyperparameter-Einstellungen)- eine
train_score-Spalte für jeden CV-Fold, einschließlich der Spaltenmean_train_scoreundstd_train_score - eine
test_score-Spalte für jeden CV-Fold, einschließlich der Spaltenmean_test_scoreundstd_test_score - eine
rank_test_score-Spalte mit einer Zahl von 1 bis n (Anzahl der Iterationen), die die Zeilen basierend auf ihremmean_test_scoreeinordnet
Diese Übung ist Teil des Kurses
Hyperparameter-Tuning in Python
Anleitung zur Übung
- Lies die Eigenschaft
cv_results_des GridSearchCV-Objektsgrid_rf_classin einen DataFrame ein und gib ihn komplett aus, um ihn zu inspizieren. - Extrahiere und gib die einzelne Spalte aus, die ein Dictionary aller in jeder Iteration der Grid Search verwendeten Hyperparameter enthält.
- Extrahiere und gib die Zeile aus, die den besten durchschnittlichen Test-Score hatte, indem du über die Spalte
rank_test_scoreindizierst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)
# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)
# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)