Taille d’échantillon pour des moyennes
Lors de la conception d’un test A/B, vous, en tant que Data Scientist, êtes responsable de vérifier d’abord si le test est réalisable. Cela implique de répondre à plusieurs questions : avons-nous suffisamment de trafic ? Comment quantifier « suffisamment » ? Quelle est la différence minimale détectable compte tenu de la taille d’échantillon dont nous disposons ? Combien de temps l’expérience doit-elle durer ? Et bien d’autres encore.
Dans cet exercice, vous allez calculer la taille minimale d’échantillon nécessaire pour détecter une différence statistiquement significative d’une certaine valeur entre la moyenne de référence order_value du groupe de contrôle et un nouveau design à tester. Les bibliothèques pandas, numpy, matplotlib, seaborn et le DataFrame checkout sont déjà importés et chargés pour vous, ainsi que power depuis statsmodels.stats.
Cet exercice fait partie du cours
A/B Testing en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate and print the baseline mean and standard deviation
mean_B = ____
print(mean_B)
std_B = ____
print(std_B)