1. Učit se
  2. /
  3. Kurzy
  4. /
  5. A/B testování v Pythonu

Connected

cvičení

Čištění dat pro A/B test

Čištění dat pro A/B testování se nijak zásadně neliší od běžného procesu, který se vyučuje v kurzech čištění a manipulace s daty. Pochopení kontextu a způsobu logování dat v každém A/B testu ti ale umožní lépe rozhodovat, jak naložit s nekonzistentními daty. Odstraňování nebo ponechání duplicit a chybějících hodnot jsou dva případy, kdy musíme pečlivě zvážit definice metrik a jejich konzistenci napříč variantami.

DataFramy AdSmart a homepage a také knihovny pandas a numpy jsou již načtené.

Zdroj datasetu Adsmart z Kaggle je k dispozici zde.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Zkontroluj duplicitní řádky v datasetu AdSmart tím, že vypíšeš počet řádků.