Evaluar imputaciones (varios modelos y variables)
Cuando crees un modelo de imputación, es buena idea compararlo con otro método.
En esta lección, te pediremos que añadas un último modelo de imputación que incluya una pieza adicional de información útil que ayuda a explicar parte de la variación en los datos. Después compararás los valores, como hiciste en la lección anterior.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando el conjunto de datos oceanbuoys:
- Imputa los datos con
impute_lm(), añadiendoyearal modelo. - Une los métodos de imputación, colocando
ocean_imp_meanenmean,ocean_imp_lm_windenlm_windyocean_imp_lm_wind_yearenlm_wind_year. - Examina los valores de
air_temp_c(en el eje x) yhumidity(en el eje y), coloreando según si hay valores ausentes, y creando facetas por modelo de imputación.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
add_label_shadow()
# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
lm_wind = ocean_imp_lm_wind,
lm_wind_year = ___,
.id = "imp_model")
# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) +
geom_point() + facet_wrap(~___)