Güte der Verteilung für die Variable ldl bewerten
In dieser Übung konzentrierst du dich auf eine Variable des Diabetes-Datensatzes dia: das Blutserum ldl. Du bestimmst, ob die Normalverteilung für ldl weiterhin eine gute Wahl ist, basierend auf den zusätzlichen Informationen eines Kolmogorov–Smirnov-Tests.
Das DataFrame dia wurde für dich geladen. Außerdem wurden die folgenden Bibliotheken importiert: pandas als pd, numpy als np und scipy.stats als st.
Diese Übung ist Teil des Kurses
Monte-Carlo-Simulationen in Python
Anleitung zur Übung
- Definiere eine Liste namens
list_of_distsmit deinen Kandidatenverteilungen: Laplace, Normalverteilung und Exponentialverteilung (in dieser Reihenfolge); verwende die korrekten Namen ausscipy.stats. - Fitte innerhalb der Schleife die Daten mit der entsprechenden Wahrscheinlichkeitsverteilung und speichere das Ergebnis als
param. - Führe einen Kolmogorov–Smirnov-Test zur Beurteilung des Goodness-of-Fit durch und speichere die Ergebnisse als
result.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)