LoslegenKostenlos loslegen

A/B-Test: Datenbereinigung

Die Bereinigung von A/B-Testdaten unterscheidet sich nicht vom üblichen Vorgehen, das du in Kursen zu Datenbereinigung und -manipulation gelernt hast. Entscheidend ist jedoch, den Kontext und das Protokollierverhalten jedes einzelnen A/B-Tests zu verstehen, um fundierte Entscheidungen zum Umgang mit unordentlichen Daten zu treffen. Das Entfernen oder Behalten von Duplikaten oder fehlenden Werten sind zwei Fälle, in denen wir bei der Definition unserer Metriken und deren Konsistenz über Varianten hinweg besonders sorgfältig sein müssen.

Die DataFrames AdSmart und homepage sowie die Bibliotheken pandas und numpy sind bereits für dich geladen.

Die Adsmart Kaggle-Datensatzquelle ist hier verlinkt.

Diese Übung ist Teil des Kurses

A/B-Tests in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Check for duplicate rows due to logging issues 
print(____(AdSmart))
print(____(AdSmart.____(keep='____')))
Code bearbeiten und ausführen