Bivariate relaties visualiseren
Als je verder wilt gaan dan alleen variabelen plotten en wilt onderzoeken of er een relatie bestaat tussen 2 variabelen, kun je een scatterplot tekenen. Dit is een grafiek waarin de waarden van twee variabelen langs twee assen worden uitgezet.
Het patroon van de punten laat zien of er een correlatie is; meestal voeg je een regressielijn toe om de trend te herkennen, als die er is:
- Een opwaarts hellende regressielijn geeft een positieve lineaire relatie tussen A en B aan (als A stijgt, heeft B de neiging ook te stijgen)
- Een neerwaarts hellende regressielijn geeft een negatieve lineaire relatie tussen A en B aan
Je kunt een scatterplot tekenen en daarna een regressiemodel maken met de volgende functies:
plot(x = A, y = B)
lm(B ~ A)
In deze oefening teken je een scatterplot en regressielijn voor de rendementreeks van de SP500 (sp500) en Citigroup (citi) van januari 2015 tot januari 2017. Beide zijn beschikbaar in je werkruimte
Deze oefening maakt deel uit van de cursus
Tijdreeksen visualiseren in R
Oefeninstructies
- Teken een scatterplot met
sp500op de x-as encitiop de y-as. - Voeg een regressielijn van
cititegensp500toe metlm()enabline().- Geef de regressie mee als het argument
regaanabline(). - Maak deze lijn rood en twee keer zo dik als de standaard.
- Geef de regressie mee als het argument
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Draw the scatterplot
# Draw a regression line