LoslegenKostenlos loslegen

Stichprobengröße für Anteilswerte

Echte Datensätze sind oft unordentlich. Als Analytics Engineer arbeitest du mit realen Daten und wirst Situationen begegnen, in denen die Varianz so hoch ist, dass sich kein aussagekräftiger Unterschied in den Metriken erkennen lässt. Dieses Problem tritt häufiger bei kontinuierlichen Metriken auf, wie dem durchschnittlichen Bestellwert in der vorherigen Übung. Es gibt mehrere Möglichkeiten, damit umzugehen. Ein Workaround ist, eine Metrik zu finden, die eine geringere Varianz hat und dennoch zu den Unternehmenszielen passt.

Hier berechnest du die Stichprobengröße für eine binäre Metrik: die Anmelderate (signup rate), die abbildet, ob sich ein Nutzer für den Service angemeldet hat oder nicht – im Gegensatz zum bezahlten Preis, der zwischen Nutzern stärker schwanken kann. Das DataFrame homepage sowie die Bibliotheken pandas, numpy sind bereits geladen, ebenso proportion_effectsize aus statsmodels.stats.proportion und power aus statsmodels.stats.

Diese Übung ist Teil des Kurses

A/B-Tests in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)
Code bearbeiten und ausführen