Explorar los resultados del grid search
Ahora vas a explorar la propiedad cv_results_ del objeto GridSearchCV definido en el vídeo. Es un diccionario que podemos leer en un DataFrame de pandas y que contiene mucha información útil sobre el grid search que acabamos de realizar.
Recordatorio de los distintos tipos de columnas en esta propiedad:
- Columnas
time_ - Columnas
param_(una por cada hiperparámetro) y la columnaparamssingular (con todos los ajustes de hiperparámetros) - Una columna
train_scorepor cada pliegue de validación cruzada, incluyendo las columnasmean_train_scoreystd_train_score - Una columna
test_scorepor cada pliegue de validación cruzada, incluyendo las columnasmean_test_scoreystd_test_score - Una columna
rank_test_scorecon un número del 1 al n (número de iteraciones) que clasifica las filas según sumean_test_score
Este ejercicio forma parte del curso
Ajuste de hiperparámetros en Python
Instrucciones del ejercicio
- Lee la propiedad
cv_results_del objeto GridSearchCVgrid_rf_classen un DataFrame y muestra todo para inspeccionarlo. - Extrae y muestra la columna singular que contiene un diccionario con todos los hiperparámetros usados en cada iteración del grid search.
- Extrae y muestra la fila que tuvo la mejor puntuación media en test indexando con la columna
rank_test_score.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)
# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)
# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)