1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. A/B Testing bằng Python

Connected

Bài tập

Cỡ mẫu cho tỷ lệ (proportions)

Dữ liệu thực tế thường lộn xộn. Là một Analytics Engineer làm việc với dữ liệu ngoài đời thực, bạn sẽ gặp những tình huống mà phương sai của dữ liệu quá lớn khiến bạn khó phát hiện ra khác biệt có ý nghĩa ở các chỉ số. Vấn đề này dễ xảy ra hơn với các chỉ số liên tục như giá trị đơn hàng trung bình trong bài trước. Có nhiều cách xử lý, nhưng một cách “lách” là tìm một chỉ số có phương sai thấp hơn nhưng vẫn bám sát mục tiêu kinh doanh.

Ở đây, bạn sẽ tính cỡ mẫu cho một chỉ số nhị phân: tỷ lệ đăng ký (signup rate), thể hiện việc người dùng có đăng ký dịch vụ hay không, thay vì mức giá trả tiền vốn có thể dao động nhiều giữa các người dùng. DataFrame homepage và các thư viện pandas, numpy đã được nạp sẵn cho bạn, cùng với proportion_effectsize từ statsmodels.stats.proportion và power từ statsmodels.stats.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tính tỷ lệ signup của landing_page 'A'.