A/B-testgegevens opschonen
A/B-testgegevens opschonen verschilt niet van het gebruikelijke proces uit cursussen over opschonen en manipuleren van data. Wel helpt het om per A/B-test de context en het loggedrag van de data te begrijpen, zodat je kunt beslissen hoe je rommelige data aanpakt. Waarden verwijderen of behouden bij duplicaten of missende waarden zijn twee gevallen waarin we voorzichtig moeten zijn met onze metriekdefinities en hoe consistent die zijn over varianten heen.
De DataFrames AdSmart en homepage en de bibliotheken pandas en numpy zijn alvast voor je geladen.
De Adsmart Kaggle-gegevensbron is hier gelinkt.
Deze oefening maakt deel uit van de cursus
A/B-testen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Check for duplicate rows due to logging issues
print(____(AdSmart))
print(____(AdSmart.____(keep='____')))