Avaliando imputações (muitos modelos e variáveis)
Quando você constrói um modelo de imputação, é uma boa prática compará-lo com outro método.
Nesta lição, você vai adicionar um modelo de imputação final que traz uma informação extra útil para explicar parte da variação nos dados. Depois, você vai comparar os valores, como foi feito na lição anterior.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando o conjunto de dados oceanbuoys:
- Impute os dados usando
impute_lm(), adicionandoyearao modelo. - Una os métodos de imputação, colocando
ocean_imp_meanemmean,ocean_imp_lm_windemlm_windeocean_imp_lm_wind_yearemlm_wind_year. - Observe os valores de
air_temp_c(no eixo x) ehumidity(no eixo y), colorindo por valores ausentes e criando facets por modelo de imputação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
add_label_shadow()
# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
lm_wind = ocean_imp_lm_wind,
lm_wind_year = ___,
.id = "imp_model")
# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) +
geom_point() + facet_wrap(~___)