Visualiser des relations bivariées
Si vous voulez aller plus loin que le simple tracé de variables et examiner l’existence d’une relation entre deux variables, vous pouvez tracer un nuage de points. Il s’agit d’un graphique où les valeurs de deux variables sont positionnées le long de deux axes.
Le motif formé par les points permet de révéler une éventuelle corrélation ; on ajoute généralement une droite de régression pour identifier la tendance, s’il y en a une :
- Une droite de régression à pente positive indique une relation linéaire positive entre A et B (quand A augmente, B a tendance à augmenter aussi).
- Une droite de régression à pente négative indique une relation linéaire négative entre A et B.
Vous pouvez tracer un nuage de points puis créer un modèle de régression avec les fonctions suivantes :
plot(x = A, y = B)
lm(B ~ A)
Dans cet exercice, vous allez tracer un nuage de points et une droite de régression pour les séries de rendements du SP500 (sp500) et de Citigroup (citi) de janvier 2015 à janvier 2017, toutes deux mises à votre disposition dans votre espace de travail
Cet exercice fait partie du cours
Visualiser des séries temporelles en R
Instructions
- Tracez un nuage de points avec
sp500sur l’axe des x etcitisur l’axe des y. - Ajoutez une droite de régression de
citien fonction desp500en utilisantlm()etabline().- Spécifiez la régression via l’argument
regdeabline(). - Faites cette ligne en rouge et deux fois plus épaisse que la valeur par défaut.
- Spécifiez la régression via l’argument
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Draw the scatterplot
# Draw a regression line