CommencerCommencer gratuitement

Graphiques de séries temporelles

La première étape de toute analyse de données consiste à les représenter graphiquement. Les graphiques vous permettent de visualiser de nombreux aspects des données : motifs, observations atypiques, évolutions dans le temps et relations entre variables. Comme le type de données détermine la méthode de prévision à utiliser, il détermine aussi les graphiques appropriés.

Vous pouvez utiliser la fonction autoplot() pour produire un graphique temporel des données, avec ou sans facettes, c’est‑à‑dire des panneaux affichant différents sous‑ensembles :

> autoplot(usnim_2002, facets = FALSE)

La méthode ci‑dessus est l’une des nombreuses vues dans ce cours qui acceptent des arguments booléens. T et TRUE signifient « vrai », et F et FALSE signifient « faux ». Cependant, T et F peuvent être redéfinis dans votre code. Par conséquent, vous devez vous appuyer uniquement sur TRUE et FALSE pour définir vos indicateurs pendant tout le reste du cours.

Vous utiliserez deux autres fonctions dans cet exercice, which.max() et frequency().
which.max() permet d’identifier l’indice le plus petit de la valeur maximale

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Pour trouver le nombre d’observations par unité de temps, utilisez frequency(). Rappelez‑vous les données usnim_2002 de l’exercice précédent :

> frequency(usnim_2002)
[1] 4

Comme ce cours utilise les packages forecast et ggplot2, ils ont été chargés pour vous dans votre espace de travail, ainsi que myts de l’exercice précédent et les trois séries suivantes (disponibles dans le package forecast) :

  • gold contenant les prix de l’or en dollars US
  • woolyrnq contenant des informations sur la production de fil de laine en Australie
  • gas contenant la production de gaz en Australie

Cet exercice fait partie du cours

Prévision en R

Afficher le cours

Instructions

  • Tracez les données que vous avez stockées dans myts avec autoplot() en utilisant des facettes.
  • Tracez les mêmes données sans facettes en définissant l’argument approprié à FALSE. Que se passe‑t‑il ?
  • Tracez les séries temporelles gold, woolyrnq et gas dans des graphiques séparés.
  • Utilisez which.max() pour repérer la valeur aberrante dans la série gold. Quelle observation est‑ce ?
  • Appliquez la fonction frequency() à chaque produit afin d’obtenir le nombre d’observations par unité de temps. Cela renverrait par exemple 52 pour des données hebdomadaires.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot the data with facetting
autoplot(___, facets = ___)

# Plot the data without facetting
___

# Plot the three series
autoplot(___)
___
___

# Find the outlier in the gold series
goldoutlier <- ___(___)

# Look at the seasonal frequencies of the three series
frequency(___)
___
___
Modifier et exécuter le code