ComeçarComece de graça

Explorando os resultados do grid search

Agora você vai explorar a propriedade cv_results_ do objeto GridSearchCV definido no vídeo. Trata-se de um dicionário que podemos carregar em um DataFrame do pandas e que contém muitas informações úteis sobre o grid search que acabamos de realizar.

Um lembrete sobre os diferentes tipos de colunas nessa propriedade:

  • colunas time_
  • colunas param_ (uma para cada hiperparâmetro) e a coluna params única (com todas as configurações de hiperparâmetros)
  • uma coluna train_score para cada dobras de CV, incluindo as colunas mean_train_score e std_train_score
  • uma coluna test_score para cada dobras de CV, incluindo as colunas mean_test_score e std_test_score
  • uma coluna rank_test_score com um número de 1 a n (número de iterações) classificando as linhas com base no seu mean_test_score

Este exercício faz parte do curso

Ajuste de Hiperparâmetros em Python

Ver curso

Instruções do exercício

  • Leia a propriedade cv_results_ do objeto GridSearchCV grid_rf_class em um DataFrame e imprima tudo para inspecionar.
  • Extraia e imprima a coluna única que contém um dicionário com todos os hiperparâmetros usados em cada iteração do grid search.
  • Extraia e imprima a linha que teve a melhor média de teste indexando pela coluna rank_test_score.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)

# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)

# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)
Editar e executar o código