ComenzarEmpieza gratis

Explorar los resultados del grid search

Ahora vas a explorar la propiedad cv_results_ del objeto GridSearchCV definido en el vídeo. Es un diccionario que podemos leer en un DataFrame de pandas y que contiene mucha información útil sobre el grid search que acabamos de realizar.

Recordatorio de los distintos tipos de columnas en esta propiedad:

  • Columnas time_
  • Columnas param_ (una por cada hiperparámetro) y la columna params singular (con todos los ajustes de hiperparámetros)
  • Una columna train_score por cada pliegue de validación cruzada, incluyendo las columnas mean_train_score y std_train_score
  • Una columna test_score por cada pliegue de validación cruzada, incluyendo las columnas mean_test_score y std_test_score
  • Una columna rank_test_score con un número del 1 al n (número de iteraciones) que clasifica las filas según su mean_test_score

Este ejercicio forma parte del curso

Ajuste de hiperparámetros en Python

Ver curso

Instrucciones del ejercicio

  • Lee la propiedad cv_results_ del objeto GridSearchCV grid_rf_class en un DataFrame y muestra todo para inspeccionarlo.
  • Extrae y muestra la columna singular que contiene un diccionario con todos los hiperparámetros usados en cada iteración del grid search.
  • Extrae y muestra la fila que tuvo la mejor puntuación media en test indexando con la columna rank_test_score.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)

# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)

# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)
Editar y ejecutar código