Power-Analyse – Teil I

Jetzt kommen wir zur Power-Analyse. Du willst in der Regel sicherstellen, dass jedes Experiment oder A/B-Test, den du durchführst, mindestens 80 % Power hat. Eine Möglichkeit, das zu gewährleisten, ist die Berechnung der Stichprobengröße, die nötig ist, um 80 % Power zu erreichen.

Angenommen, du leitest eine Nachrichten-Website und möchtest die Zeit erhöhen, die Nutzer auf deiner Website verbringen. Aktuell ist die auf deiner Website verbrachte Zeit normalverteilt mit einem Mittelwert von 1 Minute und einer Standardabweichung von 0,5 Minuten. Stell dir vor, du führst ein Feature ein, das Seiten schneller lädt, und willst wissen, welche Stichprobengröße nötig ist, um einen Anstieg der Verweildauer auf der Website um 5 % zu messen.

In dieser Übung richten wir den Rahmen für eine Simulation ein, führen einen t-Test durch und berechnen den p-Wert.

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Anleitung zur Übung

Initialisiere effect_size mit 5 %, control_mean mit 1 und control_sd mit 0,5.
Simuliere mit np.random.normal() jeweils eine Ziehung für control_time_spent und treatment_time_spent unter Verwendung der initialisierten Werte.
Führe einen t-Test auf treatment_time_spent und control_time_spent mit st.ttest_ind() aus, wobei st scipy.stats ist und bereits importiert wurde.
Die statistische Signifikanz stat_sig soll True sein, wenn p_value kleiner als 0,05 ist, andernfalls False.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Initialize effect_size, control_mean, control_sd
effect_size, sample_size, control_mean, control_sd = ____, 50, ____, ____

# Simulate control_time_spent and treatment_time_spent, assuming equal variance
control_time_spent = np.random.normal(loc=control_mean, scale=____, size=sample_size)
treatment_time_spent = np.random.normal(loc=____*(1+effect_size), scale=control_sd, size=____)

# Run the t-test and get the p_value
t_stat, p_value = st.ttest_ind(____, ____)
stat_sig = p_value < ____
print("P-value: {}, Statistically Significant? {}".format(p_value, stat_sig))

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

Statistische Simulation in Python

Mittlere SchwierigkeitSchwierigkeitsgrad

4.9+

Kurs kostenlos starten

Dieses Kapitel gibt dir die Werkzeuge an die Hand, um eine Simulation durchzuführen. Wir starten mit einem Überblick über Zufallsvariablen und Wahrscheinlichkeitsverteilungen. Anschließend lernst du, wie man eine Simulation ausführt: Wir schauen uns zuerst einen typischen Ablauf an und setzen ihn dann im Kontext eines Würfelspiels um. Zum Schluss sehen wir, wie du Simulationen für Entscheidungen einsetzen kannst.

Exercise 1: Einführung in Zufallsvariablen Exercise 2: np.random.choice()Exercise 3: Poisson-Zufallsvariable Exercise 4: Ein Kartendeck mischen Exercise 5: Grundlagen der Simulation Exercise 6: Einen fairen Würfel werfen Exercise 7: Zwei faire Würfel werfen Exercise 8: Das Würfelspiel simulieren Exercise 9: Simulation für Entscheidungen nutzen Exercise 10: Eine einzelne Lotterieziehung simulieren Exercise 11: Sollten wir kaufen?Exercise 12: Einen Break-even-Lotteriepreis berechnen

Dieses Kapitel führt dich in grundlegende Wahrscheinlichkeitskonzepte ein und vermittelt dir ein praktisches Verständnis des Datenentstehungsprozesses. Wir betrachten mehrere Beispiele zur Modellierung dieses Prozesses und schließen mit der Modellierung einer eCommerce-Werbesimulation ab.

Exercise 1: Wahrscheinlichkeitsgrundlagen Exercise 2: Dame und Pik Exercise 3: Paar (Two of a kind)Exercise 4: Game of Thirteen Exercise 5: Weitere Wahrscheinlichkeitskonzepte Exercise 6: Die bedingte Urne Exercise 7: Geburtstagsproblem Exercise 8: Full House Exercise 9: Datengenerierungsprozess Exercise 10: Fahrprüfung Exercise 11: Nationale Wahlen Exercise 12: Fitnessziele Exercise 13: eCommerce-Anzeigen-Simulation Exercise 14: Sign-up-Flow Exercise 15: Kauf-Flow Exercise 16: Wahrscheinlichkeit, Geld zu verlieren

In diesem Kapitel bekommst du eine kurze Einführung in Resampling-Methoden und ihre Anwendungen. Du lernst Bootstrap-Resampling, Jackknife-Resampling und Permutationstests kennen. Nach Abschluss dieses Kapitels kannst du einfache Resampling-Methoden für die Datenanalyse anwenden.

Exercise 1: Einführung in Resampling-Methoden Exercise 2: Ziehen mit Zurücklegen Exercise 3: Wahrscheinlichkeitsbeispiel Exercise 4: Bootstrapping Exercise 5: Einen einfachen Bootstrap durchführen Exercise 6: Nichtstandard-Schätzer Exercise 7: Bootstrapping bei Regressionen Exercise 8: Jackknife-Resampling Exercise 9: Einfache Jackknife-Schätzung – Mittelwert Exercise 10: Jackknife-Konfidenzintervall für den Median Exercise 11: Permutationstests Exercise 12: Eine einzelne Permutation erzeugen Exercise 13: Hypothesentest – Differenz der Mittelwerte Exercise 14: Hypothesis Testing – Nicht standardisierte Statistiken

In diesem Kapitel lernst du grundlegende und fortgeschrittene Anwendungen von Simulationen kennen, um reale Probleme zu lösen. Wir bearbeiten ein Problem aus der Geschäftsplanung, lernen die Monte-Carlo-Integration kennen, führen Power-Analysen mit Simulation durch und schließen mit einer Simulation eines Finanzportfolios ab. Nach Abschluss dieses Kapitels bist du bereit, Simulationen zur Lösung alltäglicher Probleme einzusetzen.

Exercise 1: Simulation für die Geschäftsplanung Exercise 2: Modellierung der Maisproduktion Exercise 3: Gewinne modellieren Exercise 4: Kosten optimieren Exercise 5: Monte-Carlo-Integration Exercise 6: Eine einfache Funktion integrieren Exercise 7: Den Wert von pi berechnen Exercise 8: Simulation für Power-Analyse Exercise 9: Faktoren, die die statistische Power beeinflussen Exercise 10: Power-Analyse – Teil I

Aktuelle Übung

Exercise 11: Power-Analyse – Teil II Exercise 12: Anwendungen in der Finanzwelt Exercise 13: Portfoliosimulation – Teil I Exercise 14: Portfoliosimulation – Teil II Exercise 15: Portfolio-Simulation – Teil III Exercise 16: Abschluss