ComeçarComece de graça

Avaliando a qualidade da imputação com margin plot

No último exercício, você imputou a média de air_temp e adicionou uma variável indicadora para sinalizar quais valores foram imputados, chamada air_temp_imp. Hora de ver o quão bem isso funcionou.

Ao examinar os dados tao, você pode ter notado que eles também contêm uma variável chamada sea_surface_temp, que razoavelmente deve ser positivamente correlacionada com air_temp. Se for o caso, você esperaria que essas duas temperaturas fossem altas ou baixas ao mesmo tempo. Imputar a média da temperatura do ar quando a temperatura do mar está alta ou baixa quebraria essa relação.

Para descobrir, neste exercício você vai selecionar as duas variáveis de temperatura e a variável indicadora e usá-las para desenhar um margin plot. Vamos avaliar a imputação pela média!

Este exercício faz parte do curso

Tratamento de Dados Ausentes com Imputações em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>% 
  select(___, ___, ___) %>%
  ___(delimiter = ___)
Editar e executar o código