Valores ausentes
Às vezes há valores ausentes em séries temporais, indicados por NA no R, e é útil saber onde eles estão. Também é importante saber como diferentes funções do R tratam valores ausentes. Em alguns casos, podemos querer ignorar as ausências, mas em outros podemos desejar imputar ou estimar os valores faltantes.
Vamos novamente considerar o conjunto de dados mensais AirPassengers, mas agora os dados do ano de 1956 estão ausentes. Neste exercício, você vai explorar as implicações dessa ausência e imputar novos dados para resolver o problema.
A função mean() calcula a média amostral, mas falha na presença de qualquer valor NA. Use mean(___, na.rm = TRUE) para calcular a média com todos os valores ausentes removidos. É comum substituir valores ausentes pela média dos valores observados. Esse esquema simples de imputação parece adequado quando aplicado ao conjunto AirPassengers?
Este exercício faz parte do curso
Análise de Séries Temporais em R
Instruções do exercício
- Use
plot()para exibir um gráfico simples deAirPassengers. Observe os dados ausentes de 1956. - Use
mean()para calcular a média amostral deAirPassengerscom os dados ausentes removidos (na.rm = TRUE). - Execute o código pré-escrito para imputar os valores médios nos seus dados ausentes.
- Use outra chamada a
plot()para replotar os dados recém-imputados deAirPassengers. - Execute o código pré-escrito para adicionar os dados completos de
AirPassengersao seu gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the AirPassengers data
plot(___)
# Compute the mean of AirPassengers
# Impute mean values to NA in AirPassengers
AirPassengers[85:96] <- mean(AirPassengers, na.rm = ___)
# Generate another plot of AirPassengers
# Add the complete AirPassengers data to your plot
rm(AirPassengers)
points(AirPassengers, type = "l", col = 2, lty = 3)