CommencerCommencer gratuitement

Évaluer l’ajustement de la distribution pour la variable ldl

Dans cet exercice, vous vous concentrez sur une variable du jeu de données sur le diabète dia : le sérum sanguin ldl. Vous déterminerez si la loi normale reste un bon choix pour ldl à partir des informations supplémentaires fournies par un test de Kolmogorov–Smirnov.

Le DataFrame dia a été chargé pour vous. Les bibliothèques suivantes ont également été importées : pandas sous pd, numpy sous np, et scipy.stats sous st.

Cet exercice fait partie du cours

Simulations de Monte Carlo en Python

Afficher le cours

Instructions

  • Définissez une liste appelée list_of_dists contenant vos lois candidates : Laplace, normale et exponentielle (dans cet ordre) ; utilisez les noms corrects de scipy.stats.
  • À l’intérieur de la boucle, ajustez les données avec la loi de probabilité correspondante et enregistrez le résultat sous param.
  • Réalisez un test de Kolmogorov–Smirnov pour évaluer la qualité de l’ajustement et enregistrez les résultats sous result.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Modifier et exécuter le code