Test t pour la différence de moyennes
Vous êtes Data Scientist dans une entreprise d’e-commerce et vous aidez l’équipe paiement à choisir la version de page de paiement qui augmente la valeur moyenne des commandes et accélère la décision d’achat.
Après avoir estimé la taille d’échantillon nécessaire et validé tous les contrôles préalables, vous allez analyser les différences de moyenne de order_value et de time_on_page entre les variantes de checkout_page afin de déterminer quelle version donne les meilleurs résultats.
Le DataFrame checkout est disponible, et pingouin, pandas et numpy ont été chargés pour vous.
Les valeurs NaN dans order_value peuvent correspondre à des utilisateurs qui n’ont pas finalisé l’achat. Vous analyserez la valeur moyenne des commandes uniquement parmi les commandes finalisées (données complètes).
Cet exercice fait partie du cours
A/B Testing en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean order values and run a t-test between variants A and B
print(checkout.____('checkout_page')['____'].____())
ttest = ____.____(x=checkout[checkout['checkout_page']=='____']['____'],
y=checkout[checkout['checkout_page']=='____']['____'],
paired=____,
alternative="____")
print(ttest)