ComenzarEmpieza gratis

La compensación del remuestreo

Una gran empresa tecnológica quiere predecir la rotación de empleados para mejorar la retención. Pero solo el 12% de los empleados se ha marchado, así que el modelo se entrena principalmente con casos de "permanencia" (88%), lo que dificulta detectar a quienes corren riesgo de irse.

Para corregir este desbalance, el equipo de RR. HH. usa remuestreo sintético para crear más casos de "salida" y equilibrar los datos.

Un requisito clave: el modelo debe evitar clasificar por error a empleados leales como "de alto riesgo de salida", para no malgastar esfuerzos de retención.

El modelo se evalúa con:

  • Exactitud en entrenamiento: predicciones correctas sobre los datos de entrenamiento.
  • Exactitud en prueba: predicciones correctas sobre datos nuevos.
  • Precisión: cuántos de los pronosticados como salientes realmente se fueron.
Métrica Modelo A (sin remuestreo) Modelo B (con remuestreo)
Exactitud en entrenamiento 85% 95%
Exactitud en prueba 82% 85%
Precisión 80% 68%

Este ejercicio forma parte del curso

Probabilidad avanzada: la incertidumbre en los datos

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio