Rendimiento del portafolio con potenciación del gradiente
Llegados a este punto, has examinado la predicción de la probabilidad de impago utilizando tanto LogisticRegression()
como XGBClassifier()
. Has examinado algunas puntuaciones y has visto muestras de las predicciones, pero ¿cuál es el efecto general sobre el rendimiento del portafolio? Intenta utilizar la pérdida esperada como escenario para expresar la importancia de probar distintos modelos.
Se ha creado un marco de datos llamado portfolio
para combinar las probabilidades de impago de ambos modelos, la pérdida en caso de impago (supongamos por ahora un 20 %), y el loan_amnt
que se supondrá que es la exposición en caso de impago.
El marco de datos cr_loan_prep
junto con los conjuntos de entrenamiento X_train
y y_train
se han cargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Utiliza
portfolio
para ver las cinco primeras filas. - Crea la columna
expected_loss
para el modelogbt
ylr
con los nombresgbt_expected_loss
ylr_expected_loss
. - Imprime la suma de
lr_expected_loss
para todoportfolio
. - Imprime la suma de
gbt_expected_loss
para todoportfolio
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Print the first five rows of the portfolio data frame
print(____.____())
# Create expected loss columns for each model using the formula
portfolio[____] = portfolio[____] * portfolio[____] * portfolio[____]
portfolio[____] = portfolio[____] * portfolio[____] * portfolio[____]
# Print the sum of the expected loss for lr
print('LR expected loss: ', np.____(____[____]))
# Print the sum of the expected loss for gbt
print('GBT expected loss: ', np.____(____[____]))