ComeçarComece de graça

Avaliando imputações (muitos modelos e variáveis)

Quando você constrói um modelo de imputação, é uma boa prática compará-lo com outro método.

Nesta lição, você vai adicionar um modelo de imputação final que traz uma informação extra útil para explicar parte da variação nos dados. Depois, você vai comparar os valores, como foi feito na lição anterior.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando o conjunto de dados oceanbuoys:

  • Impute os dados usando impute_lm(), adicionando year ao modelo.
  • Una os métodos de imputação, colocando ocean_imp_mean em mean, ocean_imp_lm_wind em lm_wind e ocean_imp_lm_wind_year em lm_wind_year.
  • Observe os valores de air_temp_c (no eixo x) e humidity (no eixo y), colorindo por valores ausentes e criando facets por modelo de imputação.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Editar e executar o código