Trucos y consejos de kNN I: ponderar donantes
Una variación de la imputación kNN que se usa con frecuencia aplica la llamada agregación ponderada por distancia. Esto significa que, cuando agregamos los valores de los vecinos para obtener un reemplazo de un valor ausente, lo hacemos usando la media ponderada y los pesos son las distancias invertidas desde cada vecino. Como resultado, los vecinos más cercanos tienen más impacto en el valor imputado.
En este ejercicio, aplicarás la agregación ponderada por distancia al imputar los datos de tao. Solo hará falta pasar dos argumentos adicionales a la función kNN(). ¡Vamos a probarlo!
Este ejercicio forma parte del curso
Tratamiento de datos faltantes con imputaciones en R
Instrucciones del ejercicio
- Carga el paquete
VIM. - Imputa
humiditycon kNN usando la media ponderada por distancia para agregar los vecinos; tendrás que especificar los argumentosnumFunyweightDist. - Ya tienes programada la gráfica de márgenes para ver los resultados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")