Aan de slagGa gratis aan de slag

Q-Q-plots om normaliteit te beoordelen

De quantiel-quantiel-plot (Q-Q-plot) is een betere grafische methode om niet-normaliteit zichtbaar te maken. In het algemeen vergelijkt een Q-Q-plot de quantielen van de data met de quantielen van een referentieverdeling; als de data uit een verdeling van hetzelfde type komen (op schaal en locatie na), dan zou je een redelijk rechte lijn moeten zien. Weet dat de vrijheidsgraden (df) verwijzen naar het aantal waarden of observaties dat het systeem waarmee je werkt kan beïnvloeden.

In de video zag je hoe je 1000 normale datapunten genereert met de functie rnorm(), hoe je qqnorm() gebruikt om de Q-Q-plot te maken, en qqline() om een rechte referentielijn toe te voegen:

> data <- rnorm(1000, mean = 3, sd = 2)
> qqnorm(data)
> qqline(data) 

In deze oefening maak je een Q-Q-plot van de logreturns van de Dow Jones in djx tegen de normale referentieverdeling, die je als visuele leidraad toevoegt. Vervolgens vergelijk je de plot met gesimuleerde gegevenssets uit normale, Student t- en uniforme verdelingen die zijn gegenereerd met de functies rnorm(), rt() en runif(). Je leert later in dit hoofdstuk meer over de t-verdeling.

Als de data uit een normale verdeling komen, zouden de punten dicht bij de rode lijn moeten liggen (al kan er aan de uiteinden wat afwijking zijn).

Ook nu is djx al in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Kwantiatief Risicobeheer in R

Cursus bekijken

Oefeninstructies

  • Maak een Q-Q-plot van djx tegen normaal met qqnorm() en voeg een rode lijn toe met qqline() en col = "red" om te beoordelen of de plot lineair is.
  • Bereken de lengte van djx met length() en ken die toe aan object n.
  • Genereer n standaardnormale variabelen met rnorm() en ken ze toe aan x1. Maak een Q-Q-plot van x1 tegen normaal en voeg weer een rode lijn toe.
  • Genereer n Student t-variabelen met 4 vrijheidsgraden en ken ze toe aan x2 (dit is al voor je gedaan). Maak een Q-Q-plot van x2 tegen normaal en voeg een rode lijn toe.
  • Genereer n uniforme variabelen en ken ze toe aan x3 (dit is al voor je gedaan). Maak een Q-Q-plot van x3 tegen normaal en voeg een rode lijn toe.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Make a Q-Q plot of djx and add a red line
___(___)
___(___, ___)

# Calculate the length of djx as n
n <- ___

# Generate n standard normal variables, make a Q-Q plot, add a red line
x1 <- ___(___)
___(___)
___(___, ___)

# Generate n Student t variables, make a Q-Q plot, add a red line
x2 <- rt(n, df = 4)
___(___)
___(___, ___)

# Generate n standard uniform variables, make a Q-Q plot, add red line
x3 <- runif(n)
___(___)
___(___, ___)
Code bewerken en uitvoeren