La compensación del remuestreo
Una gran empresa tecnológica quiere predecir la rotación de empleados para mejorar la retención. Pero solo el 12% de los empleados se ha marchado, así que el modelo se entrena principalmente con casos de "permanencia" (88%), lo que dificulta detectar a quienes corren riesgo de irse.
Para corregir este desbalance, el equipo de RR. HH. usa remuestreo sintético para crear más casos de "salida" y equilibrar los datos.
Un requisito clave: el modelo debe evitar clasificar por error a empleados leales como "de alto riesgo de salida", para no malgastar esfuerzos de retención.
El modelo se evalúa con:
- Exactitud en entrenamiento: predicciones correctas sobre los datos de entrenamiento.
- Exactitud en prueba: predicciones correctas sobre datos nuevos.
- Precisión: cuántos de los pronosticados como salientes realmente se fueron.
| Métrica | Modelo A (sin remuestreo) | Modelo B (con remuestreo) |
|---|---|---|
| Exactitud en entrenamiento | 85% | 95% |
| Exactitud en prueba | 82% | 85% |
| Precisión | 80% | 68% |
Este ejercicio forma parte del curso
Probabilidad avanzada: la incertidumbre en los datos
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio