ComenzarEmpieza gratis

Evaluar imputaciones deficientes

Para evaluar las imputaciones, ayuda saber cómo es un mal resultado. Para explorarlo, vamos a ver un método típicamente malo: imputar usando el valor medio.

En este ejercicio vamos a explorar cómo funciona la imputación por la media mediante un diagrama de caja, utilizando el conjunto de datos oceanbuoys.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

Para el conjunto de datos oceanbuoys:

  • Imputa el valor medio con impute_mean_all() y registra estas imputaciones con add_label_shadow().
  • Explora los valores imputados en humedad (humidity) usando un diagrama de caja.
  • Explora los valores imputados en la temperatura del aire (air_temp_c) usando un diagrama de caja.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Editar y ejecutar código