Gráficos de séries temporais
A primeira etapa de qualquer análise de dados é fazer um gráfico dos dados. Os gráficos permitem visualizar muitos aspectos, como padrões, observações atípicas, mudanças ao longo do tempo e relações entre variáveis. Assim como o tipo de dado determina qual método de previsão usar, ele também determina quais gráficos são mais adequados.
Você pode usar a função autoplot() para produzir um gráfico temporal dos dados com ou sem facets (ou painéis que exibem subconjuntos diferentes dos dados):
> autoplot(usnim_2002, facets = FALSE)
O método acima é um dos muitos ensinados neste curso que aceitam argumentos booleanos. Tanto T quanto TRUE significam "verdadeiro", e F e FALSE significam "falso"; no entanto, T e F podem ser sobrescritos no seu código. Por isso, você deve confiar apenas em TRUE e FALSE para definir os seus indicadores ao longo do curso.
Você usará mais duas funções neste exercício: which.max() e frequency().
which.max() pode ser usada para identificar o menor índice do valor máximo
> x <- c(4, 5, 5)
> which.max(x)
[1] 2
Para descobrir o número de observações por unidade de tempo, use frequency(). Relembre os dados usnim_2002 do exercício anterior:
> frequency(usnim_2002)
[1] 4
Como este curso utiliza os pacotes forecast e ggplot2, eles já foram carregados no seu ambiente, assim como myts do exercício anterior e as três séries a seguir (disponíveis no pacote forecast):
gold, contendo preços do ouro em dólares americanoswoolyrnq, contendo informações sobre a produção de fios de lã na Austráliagas, contendo a produção de gás na Austrália
Este exercício faz parte do curso
Previsão em R
Instruções do exercício
- Faça o gráfico dos dados que você salvou como
mytsusandoautoplot()com facets. - Faça o gráfico dos mesmos dados sem facets, definindo o argumento apropriado como
FALSE. O que acontece? - Faça gráficos das séries temporais
gold,woolyrnqegasem gráficos separados. - Use
which.max()para identificar o outlier na sériegold. Qual observação foi? - Aplique a função
frequency()a cada série para obter o número de observações por unidade de tempo. Isso retornaria 52 para dados semanais, por exemplo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the data with facetting
autoplot(___, facets = ___)
# Plot the data without facetting
___
# Plot the three series
autoplot(___)
___
___
# Find the outlier in the gold series
goldoutlier <- ___(___)
# Look at the seasonal frequencies of the three series
frequency(___)
___
___