ComeçarComece gratuitamente

Relatório de classificação padrão

Chegou a hora de dar uma olhada mais de perto na avaliação do modelo. É aqui que a definição do limite da probabilidade de inadimplência ajudará você a analisar o desempenho do modelo por meio de relatórios de classificação.

A criação de um quadro de dados das probabilidades facilita o trabalho com elas, porque você pode usar todo o poder do pandas. Aplique o limite aos dados e verifique as contagens de valores para ambas as classes de loan_status para ver quantas previsões de cada uma estão sendo criadas. Isso ajudará você a ter uma visão das pontuações do relatório de classificação.

O conjunto de dados cr_loan_prep, a regressão logística treinada clf_logistic, os valores reais do status do empréstimo y_test e as probabilidades previstas preds são carregados no espaço de trabalho.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Crie um quadro de dados apenas com as probabilidades de inadimplência do site preds chamado preds_df.
  • Reatribua os valores de loan_status com base em um limite de 0.50 para probabilidade de inadimplência em preds_df.
  • Imprima as contagens de valores do número de linhas para cada loan_status.
  • Imprima o relatório de classificação usando y_test e preds_df.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))
Editar e executar código