Comece agoraComece grátis

Avaliando imputações (muitos modelos e variáveis)

Quando você constrói um modelo de imputação, é uma boa prática compará-lo com outro método.

Nesta lição, você vai adicionar um modelo de imputação final que traz uma informação extra útil para explicar parte da variação nos dados. Depois, você vai comparar os valores, como foi feito na lição anterior.

Este exercicio faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercicio

Usando o conjunto de dados oceanbuoys:

  • Impute os dados usando impute_lm(), adicionando year ao modelo.
  • Una os métodos de imputação, colocando ocean_imp_mean em mean, ocean_imp_lm_wind em lm_wind e ocean_imp_lm_wind_year em lm_wind_year.
  • Observe os valores de air_temp_c (no eixo x) e humidity (no eixo y), colorindo por valores ausentes e criando facets por modelo de imputação.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Build a model adding year to the outcome
ocean_imp_lm_wind_year <- bind_shadow(___) %>%
  impute_lm(air_temp_c ~ wind_ew + wind_ns + ___) %>%
  impute_lm(humidity ~ wind_ew + wind_ns + ___) %>%
  add_label_shadow()

# Bind the mean, lm_wind, and lm_wind_year models together
bound_models <- bind_rows(mean = ocean_imp_mean,
                          lm_wind = ocean_imp_lm_wind,
                          lm_wind_year = ___,
                          .id = "imp_model")

# Explore air_temp and humidity, coloring by any missings, and faceting by imputation model
ggplot(___, aes(x = ___, y = ___, color = any_missing)) + 
  geom_point() + facet_wrap(~___)
Editar e Executar Código