1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. A/B Testing bằng Python

Connected

Bài tập

Làm sạch dữ liệu A/B test

Làm sạch dữ liệu cho A/B testing không khác gì quy trình thường gặp trong các khóa học về làm sạch và xử lý dữ liệu. Tuy nhiên, hiểu bối cảnh và cách ghi log dữ liệu của từng A/B test theo từng trường hợp cụ thể sẽ giúp bạn quyết định cách xử lý dữ liệu lộn xộn. Việc loại bỏ hay giữ lại dữ liệu trùng lặp hoặc giá trị thiếu là hai trường hợp mà bạn cần cẩn trọng với cách định nghĩa chỉ số và mức độ nhất quán của chúng giữa các biến thể.

Các DataFrame AdSmart và homepage cùng với thư viện pandas và numpy đã được nạp sẵn cho bạn.

Nguồn dữ liệu Kaggle của Adsmart được liên kết tại đây.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Kiểm tra các hàng trùng lặp trong bộ dữ liệu AdSmart bằng cách in ra số lượng hàng.