ComeçarComece de graça

Avaliando imputações: a escala

Embora a imputação pela média possa não parecer tão ruim quando a comparamos usando um box plot, é importante ter uma noção da variação nos dados. Por isso é fundamental explorar como a escala e a dispersão dos valores imputados mudam em relação aos dados originais.

Uma forma de avaliar se a escala das imputações é adequada é usar um gráfico de dispersão para verificar se os valores fazem sentido ou não.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando os dados com valores já imputados, ocean_imp_mean:

  • Explore as imputações na temperatura do ar (no eixo x) e na umidade (no eixo y) usando um gráfico de dispersão, lembrando de usar color = any_missing.
  • Amplie essa visualização anterior fazendo facetas por ano.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing, and faceting by year
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  ___() +  
  facet_wrap(~___)
Editar e executar o código