Comparando relatórios de modelos

Você usou modelos de regressão logística e gradient boosted trees. Agora é hora de comparar os dois para decidir qual modelo será usado nas previsões finais.

Um dos primeiros passos mais simples para comparar a capacidade de diferentes modelos de prever a probabilidade de inadimplência é olhar as métricas do classification_report(). Com isso, você consegue ver várias métricas lado a lado para cada modelo. Como os dados e modelos normalmente são desbalanceados, com poucas inadimplências, foque nas métricas para defaults por enquanto.

Os modelos treinados clf_logistic e clf_gbt foram carregados no workspace junto com suas previsões preds_df_lr e preds_df_gbt. Foi usado um cutoff de 0.4 para cada um. O conjunto de teste y_test também está disponível.

Este exercicio faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercicio

Imprima o classification_report() para as previsões da regressão logística.
Imprima o classification_report() para as previsões do gradient boosted tree.
Imprima a macro average do F-1 Score para a regressão logística usando precision_recall_fscore_support().
Imprima a macro average do F-1 Score para o gradient boosted tree usando precision_recall_fscore_support().

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))

# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])

# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])

Editar e Executar Código