Test U de Mann-Whitney
Supposons que vous êtes Analytics Engineer dans une start-up en phase initiale, où le trafic sur votre site est faible. Comme, dans de nombreux cas, vous devrez exécuter des tests longtemps pour collecter un échantillon suffisamment grand afin de respecter les hypothèses des tests paramétriques, vous pourriez avoir besoin de vous appuyer sur des tests non paramétriques pour prendre des décisions plus rapidement.
L’un de ces tests est le test U de Mann-Whitney, un test de significativité statistique qui permet de déterminer si deux échantillons indépendants proviennent d’une population avec la même distribution. Vous allez utiliser ce test pour analyser la différence de time_on_page entre deux groupes du jeu de données checkout. Le DataFrame checkout est à votre disposition et pingouin a été importé, ainsi que pandas et numpy.
Cet exercice fait partie du cours
A/B Testing en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean and count of time on page by variant
print(checkout.____('checkout_page')['____'].____({'____', '____'}))