LoslegenKostenlos loslegen

Güte der Verteilung für die Variable ldl bewerten

In dieser Übung konzentrierst du dich auf eine Variable des Diabetes-Datensatzes dia: das Blutserum ldl. Du bestimmst, ob die Normalverteilung für ldl weiterhin eine gute Wahl ist, basierend auf den zusätzlichen Informationen eines Kolmogorov–Smirnov-Tests.

Das DataFrame dia wurde für dich geladen. Außerdem wurden die folgenden Bibliotheken importiert: pandas als pd, numpy als np und scipy.stats als st.

Diese Übung ist Teil des Kurses

Monte-Carlo-Simulationen in Python

Kurs anzeigen

Anleitung zur Übung

  • Definiere eine Liste namens list_of_dists mit deinen Kandidatenverteilungen: Laplace, Normalverteilung und Exponentialverteilung (in dieser Reihenfolge); verwende die korrekten Namen aus scipy.stats.
  • Fitte innerhalb der Schleife die Daten mit der entsprechenden Wahrscheinlichkeitsverteilung und speichere das Ergebnis als param.
  • Führe einen Kolmogorov–Smirnov-Test zur Beurteilung des Goodness-of-Fit durch und speichere die Ergebnisse als result.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Code bearbeiten und ausführen