1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Thống kê bằng Python

Connected

Bài tập

Luồng đăng ký (Sign up Flow)

Giờ chúng ta sẽ mô phỏng DGP (quy trình tạo dữ liệu) của một luồng quảng cáo eCommerce, bắt đầu từ bước đăng ký.

Mỗi ngày, chúng ta có nhiều lượt hiển thị quảng cáo (ad impressions), có thể mô hình hóa bằng biến ngẫu nhiên Poisson (RV). Bạn biết rằng \(\lambda\) có phân phối chuẩn với trung bình 100k khách truy cập và độ lệch chuẩn 2000.

Trong hành trình đăng ký, khách hàng nhìn thấy quảng cáo, quyết định có nhấp hay không, rồi quyết định có đăng ký hay không. Vì vậy cả lượt nhấp và lượt đăng ký đều là nhị phân, được mô hình hóa bằng các biến ngẫu nhiên nhị thức (binomial RV). Còn xác suất thành công \(p\) thì sao? Phương án chi phí thấp hiện tại cho tỷ lệ nhấp (click-through rate) là 1% và tỷ lệ đăng ký là 20%. Một phương án chi phí cao hơn có thể tăng tỷ lệ nhấp và đăng ký lên tối đa 20%, nhưng chúng ta không chắc mức cải thiện cụ thể, nên ta mô hình hóa nó như một biến ngẫu nhiên phân phối đều (uniform RV).

Hướng dẫn

100 XP
  • Khởi tạo các dictionary ct_rate và su_rate sao cho giá trị high được lấy từ phân phối đều trong khoảng giữa giá trị low và \(1.2 \times\) giá trị low.
  • Mô hình hóa impressions như một biến ngẫu nhiên Poisson với giá trị trung bình lam.
  • Mô hình hóa clicks và signups như các biến ngẫu nhiên nhị thức với n lần lượt là impressions và clicks, và p lần lượt là ct_rate[cost] và su_rate[cost].
  • Sau đó, in ra số lượt đăng ký mô phỏng cho phương án chi phí 'high'.