1. Nauka
  2. /
  3. Kursy
  4. /
  5. Testy A/B w Pythonie

Connected

ćwiczenie

Czyszczenie danych testu A/B

Czyszczenie danych do testów A/B nie różni się zasadniczo od standardowego procesu opisywanego w kursach poświęconych czyszczeniu i przetwarzaniu danych. Jednak zrozumienie kontekstu i sposobu rejestrowania danych w każdym teście A/B z osobna pozwala podejmować świadome decyzje o tym, jak postępować z nieporządnymi danymi. Usuwanie lub zachowywanie duplikatów i brakujących wartości to dwa przypadki, w których trzeba zachować szczególną ostrożność – ważne jest, aby definicje metryk były spójne dla wszystkich wariantów.

Ramki danych AdSmart i homepage oraz biblioteki pandas i numpy są już wczytane.

Źródło zbioru danych Adsmart z Kaggle znajdziesz tutaj.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Sprawdź, czy w zbiorze danych AdSmart występują zduplikowane wiersze, wypisując liczbę wierszy.