Opeenvolgende portefeuillerendementen plotten
Regressie naar het gemiddelde is ook een belangrijk concept bij beleggen. Hier bekijk je de jaarlijkse rendementen van beleggen in bedrijven uit de Standard and Poor 500-index (S&P 500), in 2018 en 2019.
De gegevensset sp500_yearly_returns bevat drie kolommen:
| variable | meaning |
|---|---|
| symbol | Beursticker die het bedrijf uniek identificeert. |
| return_2018 | Een maat voor het beleggingsrendement in 2018. |
| return_2019 | Een maat voor het beleggingsrendement in 2019. |
Een positief getal voor het rendement betekent dat de belegging in waarde is gestegen; negatief betekent dat die waarde heeft verloren.
Net als bij honkslag-homeruns zou een naïeve voorspelling kunnen zijn dat het rendement jaar op jaar gelijk blijft, dus op de lijn y is x ligt.
sp500_yearly_returns is beschikbaar als een pandas DataFrame.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Oefeninstructies
- Maak een nieuwe figuur,
fig, om lagen te kunnen stapelen. - Genereer een lijn bij y is x. Dit is al voor je gedaan.
- Gebruik
sp500_yearly_returnsom een spreidingsdiagram vanreturn_2019versusreturn_2018te tekenen met een lineaire regressietrendlijn, zonder standaardfoutlint. - Stel de assen zo in dat de afstanden langs de x- en y-as er hetzelfde uitzien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a new figure, fig
fig = plt.____
# Plot the first layer: y = x
plt.axline(xy1=(0,0), slope=1, linewidth=2, color="green")
# Add scatter plot with linear regression trend line
sns.____(____)
# Set the axes so that the distances along the x and y axes look the same
plt.____(____)
# Show the plot
plt.show()