Informes de clasificación de impago

Es hora de examinar más detenidamente la evaluación del modelo. Aquí es donde establecer el umbral de probabilidad de impago te ayudará a analizar el rendimiento del modelo mediante informes de clasificación.

Crear un marco de datos de las probabilidades facilita el trabajo con ellas, porque puedes utilizar toda la potencia de pandas. Aplica el umbral a los datos y comprueba los recuentos de valores de ambas clases de loan_status para ver cuántas predicciones de cada una se están creando. Esto ayudará a comprender mejor las puntuaciones del informe de clasificación.

El conjunto de datos cr_loan_prep, la regresión logística entrenada clf_logistic, los valores verdaderos del estado del préstamo y_test, y las probabilidades predichas, preds se cargan en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones del ejercicio

Crea un marco de datos solo con las probabilidades de incumplimiento de preds llamado preds_df.
Reasigna los valores de loan_status basándote en un umbral de 0.50 para la probabilidad de impago en preds_df.
Imprime el recuento de valores del número de filas de cada loan_status.
Imprime el informe de clasificación utilizando y_test y preds_df.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Editar y ejecutar código