Aan de slagGa gratis aan de slag

Beoordelen van de verdelingsfit voor de variabele ldl

In deze oefening focus je op één variabele uit de diabetesgegevensset dia: het ldl-bloedserum. Je gaat bepalen of de normale verdeling nog steeds een goede keuze is voor ldl op basis van de extra informatie uit een Kolmogorov–Smirnovtest.

De dia-DataFrame is al voor je geladen. De volgende libraries zijn ook geïmporteerd: pandas als pd, numpy als np en scipy.stats als st.

Deze oefening maakt deel uit van de cursus

Monte Carlo-simulaties in Python

Cursus bekijken

Oefeninstructies

  • Definieer een lijst list_of_dists met je kandidaatverdelingen: Laplace, normaal en exponentieel (in die volgorde); gebruik de juiste namen uit scipy.stats.
  • Fit binnen de lus de data met de bijbehorende kansverdeling en sla dit op als param.
  • Voer een Kolmogorov–Smirnovtest uit om de goodness-of-fit te beoordelen en sla de resultaten op als result.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Code bewerken en uitvoeren