Aan de slagGa gratis aan de slag

Bivariate relaties visualiseren

Als je verder wilt gaan dan alleen variabelen plotten en wilt onderzoeken of er een relatie bestaat tussen 2 variabelen, kun je een scatterplot tekenen. Dit is een grafiek waarin de waarden van twee variabelen langs twee assen worden uitgezet.

Het patroon van de punten laat zien of er een correlatie is; meestal voeg je een regressielijn toe om de trend te herkennen, als die er is:

  • Een opwaarts hellende regressielijn geeft een positieve lineaire relatie tussen A en B aan (als A stijgt, heeft B de neiging ook te stijgen)
  • Een neerwaarts hellende regressielijn geeft een negatieve lineaire relatie tussen A en B aan

Je kunt een scatterplot tekenen en daarna een regressiemodel maken met de volgende functies:

plot(x = A, y = B)
lm(B ~ A)

In deze oefening teken je een scatterplot en regressielijn voor de rendementreeks van de SP500 (sp500) en Citigroup (citi) van januari 2015 tot januari 2017. Beide zijn beschikbaar in je werkruimte

Deze oefening maakt deel uit van de cursus

Tijdreeksen visualiseren in R

Cursus bekijken

Oefeninstructies

  • Teken een scatterplot met sp500 op de x-as en citi op de y-as.
  • Voeg een regressielijn van citi tegen sp500 toe met lm() en abline().
    • Geef de regressie mee als het argument reg aan abline().
    • Maak deze lijn rood en twee keer zo dik als de standaard.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Draw the scatterplot


# Draw a regression line
Code bewerken en uitvoeren