Hypothesentest – Differenz der Mittelwerte

Wir wollen die Hypothese testen, dass sich die durchschnittlichen Spenden von A und B unterscheiden. Zuvor hast du gelernt, wie man eine Permutation der Daten erzeugt. Jetzt erzeugen wir eine Nullverteilung der Differenz der Mittelwerte und berechnen anschließend den p-Wert.

Für die Nullverteilung erzeugen wir zunächst mehrere permutierte Datensätze und speichern die Differenz der Mittelwerte für jeden Fall. Dann berechnen wir die Teststatistik als die Differenz der Mittelwerte mit dem ursprünglichen Datensatz. Schließlich approximieren wir den p-Wert, indem wir den doppelten Anteil der Fälle berechnen, in denen die Differenz größer oder gleich dem Absolutwert der Teststatistik ist (zweiseitige Hypothese). Ein p-Wert von weniger als z. B. 0,05 kann dann auf statistische Signifikanz hinweisen.

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Anleitung zur Übung

Erzeuge mehrere Permutationen von donations_A und donations_B und weise sie perm zu.
Setze samples auf die Differenz der Mittelwerte von permuted_A_datasets und permuted_B_datasets. Wir setzen axis=1, damit es einen Mittelwert pro Datensatz gibt statt eines Gesamtmittelwerts.
Setze test_stat auf die Differenz der Mittelwerte von donations_A und donations_B.
Berechne den p-Wert p_val als das Doppelte des Anteils der samples, die größer oder gleich dem Absolutwert von test_stat sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Generate permutations equal to the number of repetitions
perm = np.array([np.random.____(len(____) + len(____)) for i in range(reps)])
permuted_A_datasets = data[perm[:, :len(donations_A)]]
permuted_B_datasets = data[perm[:, len(donations_A):]]

# Calculate the difference in means for each of the datasets
samples = np.mean(____, axis=1) - np.mean(____, axis=1)

# Calculate the test statistic and p-value
test_stat = ____
p_val = 2*np.sum(____ >= np.abs(____))/reps
print("p-value = {}".format(p_val))

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

Dieses Kapitel gibt dir die Werkzeuge an die Hand, um eine Simulation durchzuführen. Wir starten mit einem Überblick über Zufallsvariablen und Wahrscheinlichkeitsverteilungen. Anschließend lernst du, wie man eine Simulation ausführt: Wir schauen uns zuerst einen typischen Ablauf an und setzen ihn dann im Kontext eines Würfelspiels um. Zum Schluss sehen wir, wie du Simulationen für Entscheidungen einsetzen kannst.

Exercise 1: Einführung in Zufallsvariablen Exercise 2: np.random.choice()Exercise 3: Poisson-Zufallsvariable Exercise 4: Ein Kartendeck mischen Exercise 5: Grundlagen der Simulation Exercise 6: Einen fairen Würfel werfen Exercise 7: Zwei faire Würfel werfen Exercise 8: Das Würfelspiel simulieren Exercise 9: Simulation für Entscheidungen nutzen Exercise 10: Eine einzelne Lotterieziehung simulieren Exercise 11: Sollten wir kaufen?Exercise 12: Einen Break-even-Lotteriepreis berechnen

Dieses Kapitel führt dich in grundlegende Wahrscheinlichkeitskonzepte ein und vermittelt dir ein praktisches Verständnis des Datenentstehungsprozesses. Wir betrachten mehrere Beispiele zur Modellierung dieses Prozesses und schließen mit der Modellierung einer eCommerce-Werbesimulation ab.

Exercise 1: Wahrscheinlichkeitsgrundlagen Exercise 2: Dame und Pik Exercise 3: Paar (Two of a kind)Exercise 4: Game of Thirteen Exercise 5: Weitere Wahrscheinlichkeitskonzepte Exercise 6: Die bedingte Urne Exercise 7: Geburtstagsproblem Exercise 8: Full House Exercise 9: Datengenerierungsprozess Exercise 10: Fahrprüfung Exercise 11: Nationale Wahlen Exercise 12: Fitnessziele Exercise 13: eCommerce-Anzeigen-Simulation Exercise 14: Sign-up-Flow Exercise 15: Kauf-Flow Exercise 16: Wahrscheinlichkeit, Geld zu verlieren

In diesem Kapitel bekommst du eine kurze Einführung in Resampling-Methoden und ihre Anwendungen. Du lernst Bootstrap-Resampling, Jackknife-Resampling und Permutationstests kennen. Nach Abschluss dieses Kapitels kannst du einfache Resampling-Methoden für die Datenanalyse anwenden.

Exercise 1: Einführung in Resampling-Methoden Exercise 2: Ziehen mit Zurücklegen Exercise 3: Wahrscheinlichkeitsbeispiel Exercise 4: Bootstrapping Exercise 5: Einen einfachen Bootstrap durchführen Exercise 6: Nichtstandard-Schätzer Exercise 7: Bootstrapping bei Regressionen Exercise 8: Jackknife-Resampling Exercise 9: Einfache Jackknife-Schätzung – Mittelwert Exercise 10: Jackknife-Konfidenzintervall für den Median Exercise 11: Permutationstests Exercise 12: Eine einzelne Permutation erzeugen Exercise 13: Hypothesentest – Differenz der Mittelwerte

Aktuelle Übung

Exercise 14: Hypothesis Testing – Nicht standardisierte Statistiken

In diesem Kapitel lernst du grundlegende und fortgeschrittene Anwendungen von Simulationen kennen, um reale Probleme zu lösen. Wir bearbeiten ein Problem aus der Geschäftsplanung, lernen die Monte-Carlo-Integration kennen, führen Power-Analysen mit Simulation durch und schließen mit einer Simulation eines Finanzportfolios ab. Nach Abschluss dieses Kapitels bist du bereit, Simulationen zur Lösung alltäglicher Probleme einzusetzen.

Exercise 1: Simulation für die Geschäftsplanung Exercise 2: Modellierung der Maisproduktion Exercise 3: Gewinne modellieren Exercise 4: Kosten optimieren Exercise 5: Monte-Carlo-Integration Exercise 6: Eine einfache Funktion integrieren Exercise 7: Den Wert von pi berechnen Exercise 8: Simulation für Power-Analyse Exercise 9: Faktoren, die die statistische Power beeinflussen Exercise 10: Power-Analyse – Teil I Exercise 11: Power-Analyse – Teil II Exercise 12: Anwendungen in der Finanzwelt Exercise 13: Portfoliosimulation – Teil I Exercise 14: Portfoliosimulation – Teil II Exercise 15: Portfolio-Simulation – Teil III Exercise 16: Abschluss