Evaluar imputaciones deficientes
Para evaluar las imputaciones, ayuda saber cómo es un mal resultado. Para explorarlo, vamos a ver un método típicamente malo: imputar usando el valor medio.
En este ejercicio vamos a explorar cómo funciona la imputación por la media mediante un diagrama de caja, utilizando el conjunto de datos oceanbuoys.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Para el conjunto de datos oceanbuoys:
- Imputa el valor medio con
impute_mean_all()y registra estas imputaciones conadd_label_shadow(). - Explora los valores imputados en humedad (
humidity) usando un diagrama de caja. - Explora los valores imputados en la temperatura del aire (
air_temp_c) usando un diagrama de caja.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Impute the mean value and track the imputations
ocean_imp_mean <- bind_shadow(___) %>%
___() %>%
___()
# Explore the mean values in humidity in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()
# Explore the values in air temperature in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()