Avaliando a qualidade da imputação com margin plot
No último exercício, você imputou a média de air_temp e adicionou uma variável indicadora para sinalizar quais valores foram imputados, chamada air_temp_imp. Hora de ver o quão bem isso funcionou.
Ao examinar os dados tao, você pode ter notado que eles também contêm uma variável chamada sea_surface_temp, que razoavelmente deve ser positivamente correlacionada com air_temp. Se for o caso, você esperaria que essas duas temperaturas fossem altas ou baixas ao mesmo tempo. Imputar a média da temperatura do ar quando a temperatura do mar está alta ou baixa quebraria essa relação.
Para descobrir, neste exercício você vai selecionar as duas variáveis de temperatura e a variável indicadora e usá-las para desenhar um margin plot. Vamos avaliar a imputação pela média!
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>%
select(___, ___, ___) %>%
___(delimiter = ___)