1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Thống kê bằng Python

Connected

Bài tập

Phân tích lực kiểm định - Phần I

Giờ chúng ta chuyển sang phân tích lực kiểm định (power analysis). Thông thường, bạn muốn đảm bảo bất kỳ thí nghiệm hay A/B test nào bạn chạy đều có ít nhất 80% power. Một cách để đảm bảo điều này là tính kích thước mẫu cần thiết để đạt 80% power.

Giả sử bạn phụ trách một trang tin và muốn tăng thời gian người dùng ở lại trên website. Hiện tại, thời gian người dùng ở lại được phân phối chuẩn với trung bình 1 phút và độ lệch chuẩn 0.5 phút. Giả sử bạn sắp ra mắt một tính năng giúp tải trang nhanh hơn và muốn biết kích thước mẫu cần có để đo được mức tăng 5% về thời gian ở lại trên website.

Trong bài tập này, chúng ta sẽ thiết lập khung để chạy một mô phỏng, chạy t-test, và tính p-value.

Hướng dẫn

100 XP
  • Khởi tạo effect_size là 5%, control_mean là 1 và control_sd là 0.5.
  • Dùng np.random.normal() để mô phỏng một lần rút mẫu cho control_time_spent và treatment_time_spent với các giá trị bạn vừa khởi tạo.
  • Chạy t-test trên treatment_time_spent và control_time_spent bằng st.ttest_ind() với st là scipy.stats (đã được import sẵn).
  • Mức ý nghĩa thống kê stat_sig nên là True nếu p_value nhỏ hơn 0.05, ngược lại là False.