ComeçarComece de graça

Analisando os melhores resultados

No fim das contas, o que mais importa é o 'quadrado' com melhor desempenho em uma grid search. Felizmente, os objetos gridSearchCv do Scikit Learn têm vários parâmetros que fornecem informações-chave apenas sobre o melhor quadrado (ou a linha em cv_results_).

Três propriedades que você vai explorar são:

  • best_score_ – O score (aqui, ROC_AUC) do quadrado com melhor desempenho.
  • best_index_ – O índice da linha em cv_results_ que contém as informações do quadrado com melhor desempenho.
  • best_params_ – Um dicionário com os parâmetros que deram o melhor score, por exemplo 'max_depth': 10

O objeto da grid search grid_rf_class está disponível.

Um dataframe (cv_results_df) foi criado a partir de cv_results_ para você na linha 6. Isso vai ajudar você a indexar nos resultados.

Este exercício faz parte do curso

Ajuste de Hiperparâmetros em Python

Ver curso

Instruções do exercício

  • Extraia e imprima o score de ROC_AUC do melhor quadrado em grid_rf_class.
  • Crie uma variável a partir da linha de melhor desempenho indexando em cv_results_df.
  • Crie uma variável, best_n_estimators, extraindo o parâmetro n_estimators do melhor quadrado em grid_rf_class e imprima-o.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print out the ROC_AUC score from the best-performing square
best_score = grid_rf_class._____
print(best_score)

# Create a variable from the row related to the best-performing square
cv_results_df = pd.DataFrame(grid_rf_class.cv_results_)
best_row = cv_results_df.loc[[grid_rf_class.____]]
print(best_row)

# Get the n_estimators parameter from the best-performing square and print
best_n_estimators = grid_rf_class.____["_____"]
print(best_n_estimators)
Editar e executar o código