Informes de clasificación de impago
Es hora de examinar más detenidamente la evaluación del modelo. Aquí es donde establecer el umbral de probabilidad de impago te ayudará a analizar el rendimiento del modelo mediante informes de clasificación.
Crear un marco de datos de las probabilidades facilita el trabajo con ellas, porque puedes utilizar toda la potencia de pandas. Aplica el umbral a los datos y comprueba los recuentos de valores de ambas clases de loan_status para ver cuántas predicciones de cada una se están creando. Esto ayudará a comprender mejor las puntuaciones del informe de clasificación.
El conjunto de datos cr_loan_prep, la regresión logística entrenada clf_logistic, los valores verdaderos del estado del préstamo y_test, y las probabilidades predichas, preds se cargan en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Crea un marco de datos solo con las probabilidades de incumplimiento de
predsllamadopreds_df. - Reasigna los valores de
loan_statusbasándote en un umbral de0.50para la probabilidad de impago enpreds_df. - Imprime el recuento de valores del número de filas de cada
loan_status. - Imprime el informe de clasificación utilizando
y_testypreds_df.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))