ComenzarEmpieza gratis

Evaluar imputaciones (varios modelos y variables)

Cuando crees un modelo de imputación, es buena idea compararlo con otro método.

En esta lección, te pediremos que añadas un último modelo de imputación que incluya una pieza adicional de información útil que ayuda a explicar parte de la variación en los datos. Después compararás los valores, como hiciste en la lección anterior.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes en R

Ver curso

Instrucciones del ejercicio

Usando el conjunto de datos oceanbuoys:

  • Imputa los datos con impute_lm(), añadiendo year al modelo.
  • Une los métodos de imputación, colocando ocean_imp_mean en mean, ocean_imp_lm_wind en lm_wind y ocean_imp_lm_wind_year en lm_wind_year.
  • Examina los valores de air_temp_c (en el eje x) y humidity (en el eje y), coloreando según si hay valores ausentes, y creando facetas por modelo de imputación.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Editar y ejecutar código