Informes de clasificación de impago
Es hora de examinar más detenidamente la evaluación del modelo. Aquí es donde establecer el umbral de probabilidad de impago te ayudará a analizar el rendimiento del modelo mediante informes de clasificación.
Crear un marco de datos de las probabilidades facilita el trabajo con ellas, porque puedes utilizar toda la potencia de pandas
. Aplica el umbral a los datos y comprueba los recuentos de valores de ambas clases de loan_status
para ver cuántas predicciones de cada una se están creando. Esto ayudará a comprender mejor las puntuaciones del informe de clasificación.
El conjunto de datos cr_loan_prep
, la regresión logística entrenada clf_logistic
, los valores verdaderos del estado del préstamo y_test
, y las probabilidades predichas, preds
se cargan en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Crea un marco de datos solo con las probabilidades de incumplimiento de
preds
llamadopreds_df
. - Reasigna los valores de
loan_status
basándote en un umbral de0.50
para la probabilidad de impago enpreds_df
. - Imprime el recuento de valores del número de filas de cada
loan_status
. - Imprime el informe de clasificación utilizando
y_test
ypreds_df
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))