Grafici di serie temporali
Il primo passo in qualsiasi analisi dei dati è rappresentare i dati in un grafico. I grafici ti permettono di visualizzare molte caratteristiche dei dati, tra cui pattern, osservazioni insolite, variazioni nel tempo e relazioni tra variabili. Così come il tipo di dati determina quale metodo di forecasting usare, determina anche quali grafici sono più adatti.
Puoi usare la funzione autoplot() per ottenere un grafico temporale dei dati con o senza facet, ovvero pannelli che mostrano sottoinsiemi diversi dei dati:
> autoplot(usnim_2002, facets = FALSE)
Il metodo sopra è uno dei molti insegnati in questo corso che accettano argomenti booleani. Sia T che TRUE significano "vero" e F e FALSE significano "falso"; tuttavia, T e F possono essere sovrascritti nel tuo codice. Pertanto, per il resto del corso dovresti fare affidamento solo su TRUE e FALSE per impostare i tuoi indicatori.
Userai altre due funzioni in questo esercizio, which.max() e frequency().
which.max() può essere usata per identificare il più piccolo indice del valore massimo
> x <- c(4, 5, 5)
> which.max(x)
[1] 2
Per trovare il numero di osservazioni per unità di tempo, usa frequency(). Ricorda i dati usnim_2002 dell'esercizio precedente:
> frequency(usnim_2002)
[1] 4
Poiché in questo corso useremo i pacchetti forecast e ggplot2, sono già stati caricati nel tuo workspace, insieme a myts dall'esercizio precedente e alle seguenti tre serie (disponibili nel pacchetto forecast):
goldche contiene i prezzi dell'oro in dollari statunitensiwoolyrnqche contiene informazioni sulla produzione di filati di lana in Australiagasche contiene la produzione di gas australiana
Questo esercizio fa parte del corso
Previsioni in R
Istruzioni dell'esercizio
- Visualizza i dati che hai salvato come
mytsusandoautoplot()con i facet. - Visualizza gli stessi dati senza facet impostando l'argomento appropriato a
FALSE. Cosa succede? - Rappresenta le serie temporali
gold,woolyrnqegasin grafici separati. - Usa
which.max()per individuare l'outlier nella seriegold. Quale osservazione era? - Applica la funzione
frequency()a ciascuna commodity per ottenere il numero di osservazioni per unità di tempo. Ad esempio, per dati settimanali restituirebbe 52.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot the data with facetting
autoplot(___, facets = ___)
# Plot the data without facetting
___
# Plot the three series
autoplot(___)
___
___
# Find the outlier in the gold series
goldoutlier <- ___(___)
# Look at the seasonal frequencies of the three series
frequency(___)
___
___