ComenzarEmpieza gratis

Propósito del remuestreo

Un hospital está desarrollando un modelo de Machine Learning para predecir si los pacientes desarrollarán una enfermedad rara a partir de sus historiales médicos.

Sin embargo, en los datos históricos del hospital, solo el 5% de los pacientes fue diagnosticado con la enfermedad, mientras que el 95% estaba sano. Al probar un modelo inicial, logró un 95% de precisión, pero casi nunca predijo la enfermedad; es decir, básicamente etiquetaba a todo el mundo como «sano».

Estás asesorando al hospital y recomiendas aplicar remuestreo sintético. ¿Cuál es tu argumento principal para aplicar remuestreo en este caso?

Este ejercicio forma parte del curso

Probabilidad avanzada: la incertidumbre en los datos

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio