Évaluer l’ajustement de la distribution pour la variable ldl
Dans cet exercice, vous vous concentrez sur une variable du jeu de données sur le diabète dia : le sérum sanguin ldl. Vous déterminerez si la loi normale reste un bon choix pour ldl à partir des informations supplémentaires fournies par un test de Kolmogorov–Smirnov.
Le DataFrame dia a été chargé pour vous. Les bibliothèques suivantes ont également été importées : pandas sous pd, numpy sous np, et scipy.stats sous st.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Instructions
- Définissez une liste appelée
list_of_distscontenant vos lois candidates : Laplace, normale et exponentielle (dans cet ordre) ; utilisez les noms corrects descipy.stats. - À l’intérieur de la boucle, ajustez les données avec la loi de probabilité correspondante et enregistrez le résultat sous
param. - Réalisez un test de Kolmogorov–Smirnov pour évaluer la qualité de l’ajustement et enregistrez les résultats sous
result.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)