Sentindo o perigo da imputação pela média
Um dos métodos de imputação mais populares é a imputação pela média, em que os valores ausentes de uma variável são substituídos pela média dos valores observados nessa variável. No entanto, em muitos casos essa abordagem simples é uma má escolha. Às vezes, um olhar rápido nos dados já pode alertar você para os perigos de imputar pela média.
Neste capítulo, você vai trabalhar com uma subamostra dos dados do projeto Tropical Atmosphere Ocean (tao). O conjunto de dados é composto por medições atmosféricas feitas em dois períodos de tempo diferentes e em cinco locais distintos. Os dados vêm no pacote VIM.
Neste exercício, você vai se familiarizar com os dados e realizar uma análise simples que indicará quais podem ser as consequências da imputação pela média. Vamos dar uma olhada nos dados tao!
Este exercício faz parte do curso
Tratamento de Dados Ausentes com Imputações em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print first 10 observations
___(tao, ___)