t-Test für Unterschiede der Mittelwerte
Du bist Data Scientist in einem E‑Commerce-Unternehmen und sollst dem Payments-Team helfen, das Checkout-Design auszuwählen, das zu höherem Bestellwert und schnelleren Kaufentscheidungen führt.
Nachdem du die benötigte Stichprobengröße geschätzt und alle Plausibilitätsprüfungen bestanden hast, analysierst du die Unterschiede im durchschnittlichen order_value und der time_on_page zwischen den checkout_page-Varianten, um zu entscheiden, welches Design am besten abschneidet.
Das DataFrame checkout steht bereit, und pingouin, pandas und numpy sind bereits geladen.
NaN-Werte in order_value deuten möglicherweise auf Nutzer hin, die den Kauf nicht abgeschlossen haben. Du analysierst den durchschnittlichen Bestellwert nur für abgeschlossene Bestellungen (vollständige Daten).
Diese Übung ist Teil des Kurses
A/B-Tests in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the mean order values and run a t-test between variants A and B
print(checkout.____('checkout_page')['____'].____())
ttest = ____.____(x=checkout[checkout['checkout_page']=='____']['____'],
y=checkout[checkout['checkout_page']=='____']['____'],
paired=____,
alternative="____")
print(ttest)