Propósito del remuestreo
Un hospital está desarrollando un modelo de Machine Learning para predecir si los pacientes desarrollarán una enfermedad rara a partir de sus historiales médicos.
Sin embargo, en los datos históricos del hospital, solo el 5% de los pacientes fue diagnosticado con la enfermedad, mientras que el 95% estaba sano. Al probar un modelo inicial, logró un 95% de precisión, pero casi nunca predijo la enfermedad; es decir, básicamente etiquetaba a todo el mundo como «sano».
Estás asesorando al hospital y recomiendas aplicar remuestreo sintético. ¿Cuál es tu argumento principal para aplicar remuestreo en este caso?
Este ejercicio forma parte del curso
Probabilidad avanzada: la incertidumbre en los datos
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio