ComenzarEmpieza gratis

Comparar imputación KNN y por mediana

Todos los pasos de preprocesamiento en la función train() se aplican al conjunto de entrenamiento de cada pliegue de validación cruzada, por lo que las métricas de error reportadas incluyen los efectos del preprocesamiento.

Esto incluye el método de imputación usado (p. ej., knnImpute o medianImpute). Esto es útil porque te permite comparar distintos métodos de imputación y elegir el que mejor rinde fuera de la muestra.

median_model y knn_model están disponibles en tu espacio de trabajo, al igual que resamples, que contiene los resultados remuestreados de ambos modelos. Examina los resultados de los modelos ejecutando

dotplot(resamples, metric = "ROC")

y elige el que mejor rinda fuera de la muestra. ¿Qué método de imputación ofrece la mayor puntuación ROC fuera de la muestra para tu modelo glm?

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio