Imputa datos por debajo del rango con datos nabular
Queremos llevar un registro de los valores que imputamos. Si no lo hacemos, es muy difícil evaluar qué tan buenos son esos valores imputados.
Vamos a practicar la imputación de datos y a recrear visualizaciones del conjunto de ejercicios anterior imputando valores por debajo del rango de los datos.
Este enfoque es muy útil para explorar mejor la ausencia de datos y, además, proporciona la base para imputar valores faltantes.
Primero, vamos a imputar los datos por debajo del rango usando impute_below_all(), y luego visualizaremos los datos. Observamos que, aunque en este caso podemos ver dónde están los valores faltantes, necesitamos alguna forma de seguirles la pista. El patrón de programación para el seguimiento de valores faltantes puede ayudarte con esto.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando los datos de oceanbuoys:
- Imputa por debajo del rango usando
impute_below_all(). - Visualiza los nuevos valores faltantes con
wind_ewen el eje x yair_temp_cen el eje y. - Imputa y registra los datos con
bind_shadow(),impute_below_all()yadd_label_shadow(). - Muestra el gráfico e inspecciona los valores imputados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)
# Visualize the new missing values
ggplot(___,
aes(x = ___, y = ___)) +
geom_point()
# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>%
___() %>%
___()
# Look at the imputed values
___