Représentation graphique des rendements consécutifs d'un portefeuille
La régression à la moyenne est également un concept important en matière d'investissement. Vous trouverez ici les rendements annuels des investissements dans les entreprises de l'indice Standard and Poor 500 (S&P 500), en 2018 et 2019.
Le jeu de données sp500_yearly_returns
contient trois colonnes :
variable | sens |
---|---|
symbole | Symbole boursier identifiant de manière unique l'entreprise. |
return_2018 | Une mesure de la performance des investissements en 2018. |
return_2019 | Une mesure de la performance des investissements en 2019. |
Un chiffre positif pour le rendement signifie que l'investissement a pris de la valeur ; un chiffre négatif signifie qu'il a perdu de la valeur.
Comme pour les coups de circuit au baseball, une prédiction naïve pourrait être que la performance de l'investissement reste la même d'une année sur l'autre, sur la ligne "y égale x".
sp500_yearly_returns
est disponible sous la forme d'un DataFrame pandas
.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Instructions
- Créez une nouvelle figure,
fig
, pour permettre la superposition des parcelles. - Créez une ligne dont le point y est égal à x. Cela a été fait pour vous.
- En utilisant
sp500_yearly_returns
, dessinez un diagramme de dispersion dereturn_2019
par rapport àreturn_2018
avec une ligne de tendance de régression linéaire, sans ruban d'erreur standard. - Définissez les axes de manière à ce que les distances le long des axes x et y soient identiques.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a new figure, fig
fig = plt.____
# Plot the first layer: y = x
plt.axline(xy1=(0,0), slope=1, linewidth=2, color="green")
# Add scatter plot with linear regression trend line
sns.____(____)
# Set the axes so that the distances along the x and y axes look the same
plt.____(____)
# Show the plot
plt.show()