Graphiques Q-Q pour évaluer la normalité
Le graphique quantile-quantile (Q-Q plot) est une meilleure méthode graphique pour mettre en évidence la non-normalité. En général, un Q-Q plot compare les quantiles des données à ceux d’une distribution de référence ; si les données proviennent d’une distribution du même type (à une mise à l’échelle et une translation près), on doit observer une ligne raisonnablement droite. Sachez que les degrés de liberté (df) correspondent au nombre de valeurs ou d’observations susceptibles d’influencer le système sur lequel vous travaillez.
Dans la vidéo, vous avez vu comment générer 1000 points de données normales avec la fonction rnorm(), ainsi que comment utiliser qqnorm() pour créer le Q-Q plot, et qqline() pour ajouter une droite de référence :
> data <- rnorm(1000, mean = 3, sd = 2)
> qqnorm(data)
> qqline(data)
Dans cet exercice, vous allez créer un Q-Q plot des rendements logarithmiques du Dow Jones dans djx par rapport à la distribution normale de référence, que vous ajouterez comme guide visuel. Vous comparerez ensuite le graphique à des jeux de données simulés issus des distributions normale, Student t et uniforme générées avec les fonctions rnorm(), rt() et runif(). Vous étudierez la distribution t plus loin dans ce chapitre.
Si les données suivent une loi normale, les points doivent être proches de la ligne rouge (même s’il peut y avoir un léger écart aux extrémités).
Encore une fois, djx a été chargé dans votre espace de travail.
Cet exercice fait partie du cours
Gestion quantitative des risques avec R
Instructions
- Tracez un Q-Q plot de
djxpar rapport à la normale avecqqnorm()et ajoutez une ligne rouge avecqqline()etcol = "red"pour juger du caractère linéaire du graphique. - Calculez la longueur de
djxaveclength()et affectez-la à l’objetn. - Générez
nvariables normales standards avecrnorm()et affectez-les àx1. Tracez un Q-Q plot dex1par rapport à la normale et ajoutez une ligne rouge comme précédemment. - Générez
nvariables de Student t avec 4 degrés de liberté et affectez-les àx2(cela a été fait pour vous). Tracez un Q-Q plot dex2par rapport à la normale et ajoutez une ligne rouge. - Générez
nvariables uniformes et affectez-les àx3(cela a été fait pour vous). Tracez un Q-Q plot dex3par rapport à la normale et ajoutez une ligne rouge.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Make a Q-Q plot of djx and add a red line
___(___)
___(___, ___)
# Calculate the length of djx as n
n <- ___
# Generate n standard normal variables, make a Q-Q plot, add a red line
x1 <- ___(___)
___(___)
___(___, ___)
# Generate n Student t variables, make a Q-Q plot, add a red line
x2 <- rt(n, df = 4)
___(___)
___(___, ___)
# Generate n standard uniform variables, make a Q-Q plot, add red line
x3 <- runif(n)
___(___)
___(___, ___)