Q-Q-plots om normaliteit te beoordelen
De quantiel-quantiel-plot (Q-Q-plot) is een betere grafische methode om niet-normaliteit zichtbaar te maken. In het algemeen vergelijkt een Q-Q-plot de quantielen van de data met de quantielen van een referentieverdeling; als de data uit een verdeling van hetzelfde type komen (op schaal en locatie na), dan zou je een redelijk rechte lijn moeten zien. Weet dat de vrijheidsgraden (df) verwijzen naar het aantal waarden of observaties dat het systeem waarmee je werkt kan beïnvloeden.
In de video zag je hoe je 1000 normale datapunten genereert met de functie rnorm(), hoe je qqnorm() gebruikt om de Q-Q-plot te maken, en qqline() om een rechte referentielijn toe te voegen:
> data <- rnorm(1000, mean = 3, sd = 2)
> qqnorm(data)
> qqline(data)
In deze oefening maak je een Q-Q-plot van de logreturns van de Dow Jones in djx tegen de normale referentieverdeling, die je als visuele leidraad toevoegt. Vervolgens vergelijk je de plot met gesimuleerde gegevenssets uit normale, Student t- en uniforme verdelingen die zijn gegenereerd met de functies rnorm(), rt() en runif(). Je leert later in dit hoofdstuk meer over de t-verdeling.
Als de data uit een normale verdeling komen, zouden de punten dicht bij de rode lijn moeten liggen (al kan er aan de uiteinden wat afwijking zijn).
Ook nu is djx al in je werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Kwantiatief Risicobeheer in R
Oefeninstructies
- Maak een Q-Q-plot van
djxtegen normaal metqqnorm()en voeg een rode lijn toe metqqline()encol = "red"om te beoordelen of de plot lineair is. - Bereken de lengte van
djxmetlength()en ken die toe aan objectn. - Genereer
nstandaardnormale variabelen metrnorm()en ken ze toe aanx1. Maak een Q-Q-plot vanx1tegen normaal en voeg weer een rode lijn toe. - Genereer
nStudent t-variabelen met 4 vrijheidsgraden en ken ze toe aanx2(dit is al voor je gedaan). Maak een Q-Q-plot vanx2tegen normaal en voeg een rode lijn toe. - Genereer
nuniforme variabelen en ken ze toe aanx3(dit is al voor je gedaan). Maak een Q-Q-plot vanx3tegen normaal en voeg een rode lijn toe.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Make a Q-Q plot of djx and add a red line
___(___)
___(___, ___)
# Calculate the length of djx as n
n <- ___
# Generate n standard normal variables, make a Q-Q plot, add a red line
x1 <- ___(___)
___(___)
___(___, ___)
# Generate n Student t variables, make a Q-Q plot, add a red line
x2 <- rt(n, df = 4)
___(___)
___(___, ___)
# Generate n standard uniform variables, make a Q-Q plot, add red line
x3 <- runif(n)
___(___)
___(___, ___)