Avaliando e comparando imputações
Quando você cria um modelo de imputação, é uma boa prática compará-lo com outro método. Nesta lição, vamos comparar o conjunto de dados imputado anteriormente usando impute_lm() com o conjunto de dados imputado pela média. Ambos os conjuntos estão incluídos neste exercício como ocean_imp_lm_wind e ocean_imp_mean, respectivamente.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
- Una os modelos usando
bind_rows(), colocando o modeloocean_imp_meanemmeaneocean_imp_lm_windemlm_wind. - Observe os valores de
air_tempehumidityem um gráfico de dispersão, colocandoair_temp_cno eixo x,humidityno eixo y, colorindo por quaisquer ausências e fazendo facetas pelo modelo de imputação usado (imp_model).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Bind the models together
bound_models <- bind_rows(mean = ___,
lm_wind = ___,
.id = "imp_model")
# Inspect the values of air_temp and humidity as a scatter plot
ggplot(___,
aes(x = ___,
y = ___,
color = any_missing)) +
geom_point() +
facet_wrap(~___)