Beoordelen van de verdelingsfit voor de variabele ldl

In deze oefening focus je op één variabele uit de diabetesgegevensset dia: het ldl-bloedserum. Je gaat bepalen of de normale verdeling nog steeds een goede keuze is voor ldl op basis van de extra informatie uit een Kolmogorov–Smirnovtest.

De dia-DataFrame is al voor je geladen. De volgende libraries zijn ook geïmporteerd: pandas als pd, numpy als np en scipy.stats als st.

Deze oefening maakt deel uit van de cursus

Monte Carlo-simulaties in Python

Bekijk cursus

Oefeninstructies

Definieer een lijst list_of_dists met je kandidaatverdelingen: Laplace, normaal en exponentieel (in die volgorde); gebruik de juiste namen uit scipy.stats.
Fit binnen de lus de data met de bijbehorende kansverdeling en sla dit op als param.
Voer een Kolmogorov–Smirnovtest uit om de goodness-of-fit te beoordelen en sla de resultaten op als result.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)

Code bewerken en uitvoeren