ComeçarComece de graça

Valores ausentes

Às vezes há valores ausentes em séries temporais, indicados por NA no R, e é útil saber onde eles estão. Também é importante saber como diferentes funções do R tratam valores ausentes. Em alguns casos, podemos querer ignorar as ausências, mas em outros podemos desejar imputar ou estimar os valores faltantes.

Vamos novamente considerar o conjunto de dados mensais AirPassengers, mas agora os dados do ano de 1956 estão ausentes. Neste exercício, você vai explorar as implicações dessa ausência e imputar novos dados para resolver o problema.

A função mean() calcula a média amostral, mas falha na presença de qualquer valor NA. Use mean(___, na.rm = TRUE) para calcular a média com todos os valores ausentes removidos. É comum substituir valores ausentes pela média dos valores observados. Esse esquema simples de imputação parece adequado quando aplicado ao conjunto AirPassengers?

Este exercício faz parte do curso

Análise de Séries Temporais em R

Ver curso

Instruções do exercício

  • Use plot() para exibir um gráfico simples de AirPassengers. Observe os dados ausentes de 1956.
  • Use mean() para calcular a média amostral de AirPassengers com os dados ausentes removidos (na.rm = TRUE).
  • Execute o código pré-escrito para imputar os valores médios nos seus dados ausentes.
  • Use outra chamada a plot() para replotar os dados recém-imputados de AirPassengers.
  • Execute o código pré-escrito para adicionar os dados completos de AirPassengers ao seu gráfico.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot the AirPassengers data
plot(___)

# Compute the mean of AirPassengers


# Impute mean values to NA in AirPassengers
AirPassengers[85:96] <- mean(AirPassengers, na.rm = ___)

# Generate another plot of AirPassengers


# Add the complete AirPassengers data to your plot
rm(AirPassengers)
points(AirPassengers, type = "l", col = 2, lty = 3)
Editar e executar o código