Cómo afectan los umbrales al rendimiento
Fijar el umbral en 0.4
muestra resultados prometedores para la evaluación del modelo. Ahora puedes evaluar el impacto financiero utilizando la retirada por defecto que se selecciona en el informe de clasificación mediante la función precision_recall_fscore_support()
.
Para ello, estimarás el importe de la pérdida inesperada utilizando la recuperación de impagos para averiguar qué proporción de impagos no capturaste con el nuevo umbral. Será una cantidad en dólares que te indica las pérdidas que tendrías si todos los impagos no encontrados se produjeran a la vez.
Se ha calculado el valor medio del préstamo, avg_loan_amnt
y se ha puesto a disposición en el espacio de trabajo junto con preds_df
y y_test
.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Reasigna los valores
loan_status
utilizando el umbral0.4
. - Almacena el número de valores por defecto en
preds_df
seleccionando el segundo valor del recuento de valores y almacenándolo comonum_defaults
. - Obtén la tasa de recuperación por defecto de la matriz de clasificación y guárdala como
default_recall
- Estima la pérdida inesperada de la nueva retirada por impago multiplicando
1 - default_recall
por el importe medio del préstamo y el número de préstamos impagados.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))