Avaliando imputações: a escala
Embora a imputação pela média possa não parecer tão ruim quando a comparamos usando um box plot, é importante ter uma noção da variação nos dados. Por isso é fundamental explorar como a escala e a dispersão dos valores imputados mudam em relação aos dados originais.
Uma forma de avaliar se a escala das imputações é adequada é usar um gráfico de dispersão para verificar se os valores fazem sentido ou não.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando os dados com valores já imputados, ocean_imp_mean:
- Explore as imputações na temperatura do ar (no eixo x) e na umidade (no eixo y) usando um gráfico de dispersão, lembrando de usar
color = any_missing. - Amplie essa visualização anterior fazendo facetas por ano.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Explore imputations in air temperature and humidity,
# coloring by the variable, any_missing, and faceting by year
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
___() +
facet_wrap(~___)