1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu Bayesian với Python

Connected

Bài tập

Tỷ lệ click hậu nghiệm

Sau một giai đoạn thành công tại Bộ Y tế, bạn chuyển sang lĩnh vực marketing. Công ty mới của bạn vừa chạy hai chiến dịch quảng cáo thử nghiệm: một cho giày thể thao và một cho quần áo. Nhiệm vụ của bạn là tìm ra chiến dịch nào hiệu quả hơn dựa trên tỷ lệ nhấp (click-through rate) và nên được triển khai cho tệp khách hàng lớn hơn.

Bạn quyết định chạy thử nghiệm A/B, mô hình hóa dữ liệu bằng phân phối nhị thức (binomial likelihood). Bạn biết rằng tỷ lệ nhấp điển hình của các quảng cáo trước đây gần đây khoảng 15%, với kết quả dao động từ 5% đến 30%. Dựa trên đó, bạn kết luận rằng \(Beta(10, 50)\) sẽ là prior phù hợp cho tỷ lệ nhấp.

Dữ liệu ads, hàm simulate_beta_posterior() mà bạn đã thấy trong video, và numpy (dưới tên np) đều có sẵn trong môi trường làm việc của bạn.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Mô phỏng 100000 mẫu từ phân phối prior và gán kết quả vào prior_draws.
  • Vẽ mật độ của prior_draws để kiểm tra xem nó có phản ánh hiểu biết trước của bạn về tỷ lệ nhấp hay không.