Comece agoraComece grátis

Valores ausentes

Às vezes há valores ausentes em séries temporais, indicados por NA no R, e é útil saber onde eles estão. Também é importante saber como diferentes funções do R tratam valores ausentes. Em alguns casos, podemos querer ignorar as ausências, mas em outros podemos desejar imputar ou estimar os valores faltantes.

Vamos novamente considerar o conjunto de dados mensais AirPassengers, mas agora os dados do ano de 1956 estão ausentes. Neste exercício, você vai explorar as implicações dessa ausência e imputar novos dados para resolver o problema.

A função mean() calcula a média amostral, mas falha na presença de qualquer valor NA. Use mean(___, na.rm = TRUE) para calcular a média com todos os valores ausentes removidos. É comum substituir valores ausentes pela média dos valores observados. Esse esquema simples de imputação parece adequado quando aplicado ao conjunto AirPassengers?

Este exercicio faz parte do curso

Análise de Séries Temporais em R

Ver curso

Instruções do exercicio

  • Use plot() para exibir um gráfico simples de AirPassengers. Observe os dados ausentes de 1956.
  • Use mean() para calcular a média amostral de AirPassengers com os dados ausentes removidos (na.rm = TRUE).
  • Execute o código pré-escrito para imputar os valores médios nos seus dados ausentes.
  • Use outra chamada a plot() para replotar os dados recém-imputados de AirPassengers.
  • Execute o código pré-escrito para adicionar os dados completos de AirPassengers ao seu gráfico.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Plot the AirPassengers data
plot(___)

# Compute the mean of AirPassengers


# Impute mean values to NA in AirPassengers
AirPassengers[85:96] <- mean(AirPassengers, na.rm = ___)

# Generate another plot of AirPassengers


# Add the complete AirPassengers data to your plot
rm(AirPassengers)
points(AirPassengers, type = "l", col = 2, lty = 3)
Editar e Executar Código