Comparação de relatórios de modelos
Você usou modelos de regressão logística e árvores com gradiente aumentado. É hora de comparar esses dois modelos para ver qual deles será usado para fazer as previsões finais.
Uma das primeiras etapas mais fáceis para comparar a capacidade de diferentes modelos de prever a probabilidade de inadimplência é analisar seus indicadores no site classification_report()
. Com isso, você pode ver várias métricas de pontuação diferentes lado a lado para cada modelo. Como os dados e os modelos normalmente são desequilibrados com poucas inadimplências, concentre-se nas métricas de inadimplência por enquanto.
Os modelos treinados clf_logistic
e clf_gbt
foram carregados no espaço de trabalho juntamente com suas previsões preds_df_lr
e preds_df_gbt
. Foi usado um ponto de corte de 0.4
para cada um. O conjunto de teste y_test
também está disponível.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Imprima o endereço
classification_report()
para as previsões de regressão logística. - Imprima o endereço
classification_report()
para as previsões de árvore com gradiente aumentado. - Imprima o endereço
macro average
do F-1 Score para a regressão logística usandoprecision_recall_fscore_support()
. - Imprima o endereço
macro average
do F-1 Score para a árvore impulsionada por gradiente usandoprecision_recall_fscore_support()
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))
# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))
# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])
# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])