Aan de slagGa gratis aan de slag

Verdelingen in balans

Een andere snelle manier om te checken op randomisatiebias in onze A/B-tests is door te kijken hoe (on)gebalanceerd de verdelingen zijn van metriekwaarden en kenmerken die niet zouden moeten verschillen tussen de varianten. Grote verschillen in het percentage van bepaalde apparaten, browsers of besturingssystemen, ervan uitgaande dat onze steekproeven groot genoeg zijn, kunnen wijzen op grotere problemen in onze interne setup. Bekijk de datasets AdSmart en checkout die voor je zijn geladen en controleer de interne validiteit aan de hand van de verdelingen van kenmerken. Welke dataset lijkt een betere interne setup te hebben?

De Adsmart Kaggle-datasetbron vind je hier.

Deze oefening maakt deel uit van de cursus

A/B-testen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Check the distribution of platform_os by experiment groups
AdSmart.____('____')['____'].____(normalize=____)
Code bewerken en uitvoeren