Explorando os resultados do grid search
Agora você vai explorar a propriedade cv_results_ do objeto GridSearchCV definido no vídeo. Trata-se de um dicionário que podemos carregar em um DataFrame do pandas e que contém muitas informações úteis sobre o grid search que acabamos de realizar.
Um lembrete sobre os diferentes tipos de colunas nessa propriedade:
- colunas
time_ - colunas
param_(uma para cada hiperparâmetro) e a colunaparamsúnica (com todas as configurações de hiperparâmetros) - uma coluna
train_scorepara cada dobras de CV, incluindo as colunasmean_train_scoreestd_train_score - uma coluna
test_scorepara cada dobras de CV, incluindo as colunasmean_test_scoreestd_test_score - uma coluna
rank_test_scorecom um número de 1 a n (número de iterações) classificando as linhas com base no seumean_test_score
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Instruções do exercício
- Leia a propriedade
cv_results_do objeto GridSearchCVgrid_rf_classem um DataFrame e imprima tudo para inspecionar. - Extraia e imprima a coluna única que contém um dicionário com todos os hiperparâmetros usados em cada iteração do grid search.
- Extraia e imprima a linha que teve a melhor média de teste indexando pela coluna
rank_test_score.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)
# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)
# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)