Power-Analyse – Teil II

Zuvor haben wir eine Instanz des Experiments simuliert und einen p-Wert erzeugt. Jetzt nutzen wir diesen Rahmen, um die statistische Power zu berechnen. Die Power eines Experiments ist die Fähigkeit des Experiments, einen Unterschied zwischen Treatment und Control zu erkennen, wenn der Unterschied tatsächlich existiert. Gute statistische Praxis ist es, auf 80 % Power hinzuarbeiten.

Für unsere Website wollen wir wissen, wie viele Personen jede Variante besuchen müssen, damit wir einen Anstieg der aufgewendeten Zeit um 10 % mit 80 % Power erkennen können. Dafür starten wir mit einer kleinen Stichprobe (50), simulieren mehrere Instanzen dieses Experiments und prüfen die Power. Wenn 80 % erreicht sind, stoppen wir. Wenn nicht, erhöhen wir die Stichprobengröße und versuchen es erneut.

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Anleitung zur Übung

Setze für die Zufallsvariablen time_spent size als Tupel, sodass die Form sample_size × sims ist.
Berechne power als den Anteil der p-Werte kleiner als 0,05 (statistisch signifikant).
Wenn power größer oder gleich 80 % ist, break aus der while-Schleife. Andernfalls erhöhe sample_size weiterhin in Schritten von 10.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

sample_size = 50

# Keep incrementing sample size by 10 till we reach required power
while 1:
    control_time_spent = np.random.normal(loc=control_mean, scale=control_sd, size=(____,____)))
    treatment_time_spent = np.random.normal(loc=control_mean*(1+effect_size), scale=control_sd, size=(____,____))
    t, p = st.ttest_ind(treatment_time_spent, control_time_spent)
    
    # Power is the fraction of times in the simulation when the p-value was less than 0.05
    power = (p < 0.05).sum()/____
    if ____: 
        ____
    else: 
        ____ += ____
print("For 80% power, sample size required = {}".format(sample_size))

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

Dieses Kapitel gibt dir die Werkzeuge an die Hand, um eine Simulation durchzuführen. Wir starten mit einem Überblick über Zufallsvariablen und Wahrscheinlichkeitsverteilungen. Anschließend lernst du, wie man eine Simulation ausführt: Wir schauen uns zuerst einen typischen Ablauf an und setzen ihn dann im Kontext eines Würfelspiels um. Zum Schluss sehen wir, wie du Simulationen für Entscheidungen einsetzen kannst.

Exercise 1: Einführung in Zufallsvariablen Exercise 2: np.random.choice()Exercise 3: Poisson-Zufallsvariable Exercise 4: Ein Kartendeck mischen Exercise 5: Grundlagen der Simulation Exercise 6: Einen fairen Würfel werfen Exercise 7: Zwei faire Würfel werfen Exercise 8: Das Würfelspiel simulieren Exercise 9: Simulation für Entscheidungen nutzen Exercise 10: Eine einzelne Lotterieziehung simulieren Exercise 11: Sollten wir kaufen?Exercise 12: Einen Break-even-Lotteriepreis berechnen

Dieses Kapitel führt dich in grundlegende Wahrscheinlichkeitskonzepte ein und vermittelt dir ein praktisches Verständnis des Datenentstehungsprozesses. Wir betrachten mehrere Beispiele zur Modellierung dieses Prozesses und schließen mit der Modellierung einer eCommerce-Werbesimulation ab.

Exercise 1: Wahrscheinlichkeitsgrundlagen Exercise 2: Dame und Pik Exercise 3: Paar (Two of a kind)Exercise 4: Game of Thirteen Exercise 5: Weitere Wahrscheinlichkeitskonzepte Exercise 6: Die bedingte Urne Exercise 7: Geburtstagsproblem Exercise 8: Full House Exercise 9: Datengenerierungsprozess Exercise 10: Fahrprüfung Exercise 11: Nationale Wahlen Exercise 12: Fitnessziele Exercise 13: eCommerce-Anzeigen-Simulation Exercise 14: Sign-up-Flow Exercise 15: Kauf-Flow Exercise 16: Wahrscheinlichkeit, Geld zu verlieren

In diesem Kapitel bekommst du eine kurze Einführung in Resampling-Methoden und ihre Anwendungen. Du lernst Bootstrap-Resampling, Jackknife-Resampling und Permutationstests kennen. Nach Abschluss dieses Kapitels kannst du einfache Resampling-Methoden für die Datenanalyse anwenden.

Exercise 1: Einführung in Resampling-Methoden Exercise 2: Ziehen mit Zurücklegen Exercise 3: Wahrscheinlichkeitsbeispiel Exercise 4: Bootstrapping Exercise 5: Einen einfachen Bootstrap durchführen Exercise 6: Nichtstandard-Schätzer Exercise 7: Bootstrapping bei Regressionen Exercise 8: Jackknife-Resampling Exercise 9: Einfache Jackknife-Schätzung – Mittelwert Exercise 10: Jackknife-Konfidenzintervall für den Median Exercise 11: Permutationstests Exercise 12: Eine einzelne Permutation erzeugen Exercise 13: Hypothesentest – Differenz der Mittelwerte Exercise 14: Hypothesis Testing – Nicht standardisierte Statistiken

In diesem Kapitel lernst du grundlegende und fortgeschrittene Anwendungen von Simulationen kennen, um reale Probleme zu lösen. Wir bearbeiten ein Problem aus der Geschäftsplanung, lernen die Monte-Carlo-Integration kennen, führen Power-Analysen mit Simulation durch und schließen mit einer Simulation eines Finanzportfolios ab. Nach Abschluss dieses Kapitels bist du bereit, Simulationen zur Lösung alltäglicher Probleme einzusetzen.

Exercise 1: Simulation für die Geschäftsplanung Exercise 2: Modellierung der Maisproduktion Exercise 3: Gewinne modellieren Exercise 4: Kosten optimieren Exercise 5: Monte-Carlo-Integration Exercise 6: Eine einfache Funktion integrieren Exercise 7: Den Wert von pi berechnen Exercise 8: Simulation für Power-Analyse Exercise 9: Faktoren, die die statistische Power beeinflussen Exercise 10: Power-Analyse – Teil I Exercise 11: Power-Analyse – Teil II

Aktuelle Übung

Exercise 12: Anwendungen in der Finanzwelt Exercise 13: Portfoliosimulation – Teil I Exercise 14: Portfoliosimulation – Teil II Exercise 15: Portfolio-Simulation – Teil III Exercise 16: Abschluss