Beoordelen van de verdelingsfit voor de variabele ldl
In deze oefening focus je op één variabele uit de diabetesgegevensset dia: het ldl-bloedserum. Je gaat bepalen of de normale verdeling nog steeds een goede keuze is voor ldl op basis van de extra informatie uit een Kolmogorov–Smirnovtest.
De dia-DataFrame is al voor je geladen. De volgende libraries zijn ook geïmporteerd: pandas als pd, numpy als np en scipy.stats als st.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Oefeninstructies
- Definieer een lijst
list_of_distsmet je kandidaatverdelingen: Laplace, normaal en exponentieel (in die volgorde); gebruik de juiste namen uitscipy.stats. - Fit binnen de lus de data met de bijbehorende kansverdeling en sla dit op als
param. - Voer een Kolmogorov–Smirnovtest uit om de goodness-of-fit te beoordelen en sla de resultaten op als
result.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)