Analisando os melhores resultados
No fim das contas, o que mais importa é o 'quadrado' com melhor desempenho em uma grid search. Felizmente, os objetos gridSearchCv do Scikit Learn têm vários parâmetros que fornecem informações-chave apenas sobre o melhor quadrado (ou a linha em cv_results_).
Três propriedades que você vai explorar são:
best_score_– O score (aqui, ROC_AUC) do quadrado com melhor desempenho.best_index_– O índice da linha emcv_results_que contém as informações do quadrado com melhor desempenho.best_params_– Um dicionário com os parâmetros que deram o melhor score, por exemplo'max_depth': 10
O objeto da grid search grid_rf_class está disponível.
Um dataframe (cv_results_df) foi criado a partir de cv_results_ para você na linha 6. Isso vai ajudar você a indexar nos resultados.
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Instruções do exercício
- Extraia e imprima o score de ROC_AUC do melhor quadrado em
grid_rf_class. - Crie uma variável a partir da linha de melhor desempenho indexando em
cv_results_df. - Crie uma variável,
best_n_estimators, extraindo o parâmetron_estimatorsdo melhor quadrado emgrid_rf_classe imprima-o.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print out the ROC_AUC score from the best-performing square
best_score = grid_rf_class._____
print(best_score)
# Create a variable from the row related to the best-performing square
cv_results_df = pd.DataFrame(grid_rf_class.cv_results_)
best_row = cv_results_df.loc[[grid_rf_class.____]]
print(best_row)
# Get the n_estimators parameter from the best-performing square and print
best_n_estimators = grid_rf_class.____["_____"]
print(best_n_estimators)