Este ejercicio forma parte del curso
En este primer capítulo, hablaremos sobre el concepto de riesgo de crédito y definiremos cómo se calcula. Utilizando tablas cruzadas y gráficos, exploraremos un conjunto de datos real. Y, antes de aplicar el machine learning, procesaremos estos datos buscando y resolviendo problemas.
Con los datos del préstamo totalmente preparados, hablaremos del modelo de regresión logística, que es un estándar en la modelización del riesgo. Comprenderemos los componentes de este modelo, así como la forma de puntuar su rendimiento. Una vez creadas las previsiones, podremos explorar el impacto financiero de la utilización de este modelo.
Ejercicio actual
Los árboles de decisión son otro modelo estándar de riesgo crediticio. Iremos más allá de los árboles de decisión utilizando el paquete XGBoost, que está de moda, en Python para crear árboles impulsados por gradiente. Tras desarrollar modelos sofisticados, someteremos a test de estrés su rendimiento y hablaremos de qué es la selección de columnas en datos no equilibrados.
Tras desarrollar y probar dos potentes modelos de machine learning, utilizaremos métricas de rendimiento clave para compararlos. Utilizando técnicas avanzadas de selección de modelos específicamente para la modelización financiera, seleccionaremos un modelo. Con ese modelo, haremos lo siguiente: desarrollar una estrategia empresarial, calcular el valor del portafolio y minimizar la pérdida esperada.