Aan de slagGa gratis aan de slag

Grafische methoden om normaliteit te beoordelen

In de video heb je geleerd hoe je een histogram met 20 bakken maakt dat de kansdichtheid van de FTSE-gegevens weergeeft, en hoe je een normale verdeling toevoegt aan de bestaande plot als een rode lijn:

> hist(ftse, nclass = 20, probability = TRUE)
> lines(ftse, dnorm(ftse, mean = mu, sd = sigma), col = "red")

Zoals je ziet berekent dnorm(x, mean, sd) de kansdichtheidsfunctie (PDF) van de gegevens x met het berekende steekproefgemiddelde en de standaardafwijking; dit staat bekend als de momentenmethode.

Om tenslotte een schatting van de dichtheid van gegevens x te berekenen, gebruik je density(x). Dit maakt een zogenoemde kernel-dichtheidsschatting (KDE) met een niet-parametrische methode die geen aannames doet over de onderliggende verdeling.

De verschillende plots suggereren dat de gegevens zwaardere staarten hebben dan normaal, al leer je in volgende oefeningen betere grafische en numerieke toetsen kennen.

In deze oefening pas je een normale verdeling aan op de log-rendementen van de Dow Jones-index voor 2008‑2009 en vergelijk je de gegevens met de aangepaste verdeling met behulp van een histogram en een dichtheidsplot. Het object djx met Dow Jones-gegevens is in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Kwantiatief Risicobeheer in R

Cursus bekijken

Oefeninstructies

  • Bereken het gemiddelde en de standaardafwijking (sd()) van de djx-gegevens en ken deze respectievelijk toe aan mu en sigma.
  • Plot een histogram van djx met 20 bakken dat de kansdichtheid van de gegevens weergeeft.
  • Vul de functies lines() en dnorm() in om de normale dichtheidskromme voor djx als rode lijn aan het histogram toe te voegen.
  • Plot een kernel-dichtheidsschatting voor djx met density().
  • Gebruik hetzelfde lines()-commando als hierboven om de normale dichtheidskromme voor djx als rode lijn aan de KDE toe te voegen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate average and standard deviation of djx
mu <- ___
sigma <- ___

# Plot histogram of djx
___(___)

# Add the normal density as a red line to histogram
lines(___, dnorm(___), col = ___)

# Plot non-parametric KDE of djx
___(___)

# Add the normal density as red line to KDE
lines(___, dnorm(___), col = ___)
Code bewerken en uitvoeren