Équilibre des distributions
Une autre façon de détecter rapidement un biais de randomisation dans nos tests A/B consiste à examiner l’équilibre des distributions des métriques et des attributs qui ne devraient pas varier entre les différentes variantes. D’importantes différences dans la proportion de certains appareils, navigateurs ou systèmes d’exploitation, par exemple, en supposant que nos échantillons soient suffisamment grands, peuvent signaler des problèmes plus profonds dans notre configuration interne. Examinez les jeux de données AdSmart et checkout déjà chargés et vérifiez la validité interne à l’aide des distributions d’attributs. Quel jeu de données semble présenter une configuration interne plus valide ?
La source du jeu de données Adsmart sur Kaggle est disponible ici : lien
Cet exercice fait partie du cours
A/B Testing en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Check the distribution of platform_os by experiment groups
AdSmart.____('____')['____'].____(normalize=____)