ComenzarEmpieza gratis

Trucos y consejos de kNN I: ponderar donantes

Una variación de la imputación kNN que se usa con frecuencia aplica la llamada agregación ponderada por distancia. Esto significa que, cuando agregamos los valores de los vecinos para obtener un reemplazo de un valor ausente, lo hacemos usando la media ponderada y los pesos son las distancias invertidas desde cada vecino. Como resultado, los vecinos más cercanos tienen más impacto en el valor imputado.

En este ejercicio, aplicarás la agregación ponderada por distancia al imputar los datos de tao. Solo hará falta pasar dos argumentos adicionales a la función kNN(). ¡Vamos a probarlo!

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Instrucciones del ejercicio

  • Carga el paquete VIM.
  • Imputa humidity con kNN usando la media ponderada por distancia para agregar los vecinos; tendrás que especificar los argumentos numFun y weightDist.
  • Ya tienes programada la gráfica de márgenes para ver los resultados.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the VIM package
___(___)

# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao, 
               k = 5, 
               variable = "humidity", 
               ___ = ___,
               ___ = ___)

tao_imp %>% 
	select(sea_surface_temp, humidity, humidity_imp) %>% 
	marginplot(delimiter = "imp")
Editar y ejecutar código