CommencerCommencer gratuitement

Taille d’échantillon pour des proportions

Les jeux de données réels peuvent être désordonnés. En tant qu’Analytics Engineer travaillant avec des données du monde réel, vous rencontrerez des situations où la variance est trop élevée pour détecter une différence significative dans les métriques. Ce problème survient plus souvent avec des métriques continues, comme la valeur moyenne de commande dans l’exercice précédent. Il existe plusieurs façons d’y remédier, mais une solution consiste à trouver une métrique avec une variance plus faible tout en restant alignée sur les objectifs métier.

Ici, vous allez calculer la taille d’échantillon pour une métrique binaire : le taux d’inscription, qui indique si un utilisateur s’est inscrit au service ou non, par opposition au prix payé qui peut varier davantage d’un utilisateur à l’autre. Le DataFrame homepage et les bibliothèques pandas, numpy sont déjà chargés pour vous, ainsi que proportion_effectsize depuis statsmodels.stats.proportion et power depuis statsmodels.stats.

Cet exercice fait partie du cours

A/B Testing en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)
Modifier et exécuter le code