1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô phỏng Thống kê bằng Python

Connected

Bài tập

Kiểm định giả thuyết - Chênh lệch trung bình

Chúng ta muốn kiểm định giả thuyết rằng có sự khác biệt về mức quyên góp trung bình nhận được từ A và B. Trước đó, bạn đã học cách tạo một hoán vị của dữ liệu. Giờ, chúng ta sẽ tạo phân phối rỗng của chênh lệch trung bình và sau đó tính p-value.

Với phân phối rỗng, trước tiên ta tạo nhiều bộ dữ liệu đã hoán vị và lưu lại chênh lệch trung bình cho mỗi trường hợp. Tiếp theo, ta tính thống kê kiểm định là chênh lệch trung bình với bộ dữ liệu gốc. Cuối cùng, ta xấp xỉ p-value bằng cách tính gấp đôi tỉ lệ số trường hợp có chênh lệch lớn hơn hoặc bằng giá trị tuyệt đối của thống kê kiểm định (giả thuyết hai phía). Một p-value nhỏ hơn, chẳng hạn 0.05, có thể cho thấy ý nghĩa thống kê.

Hướng dẫn

100 XP
  • Tạo nhiều hoán vị của donations_A & donations_B và gán vào perm.
  • Gán samples bằng chênh lệch trung bình của permuted_A_datasets & permuted_B_datasets. Ta đặt axis=1 để có trung bình cho từng bộ dữ liệu thay vì trung bình gộp.
  • Gán test_stat bằng chênh lệch trung bình của donations_A & donations_B.
  • Tính p-value p_val bằng gấp đôi tỉ lệ phần tử trong samples lớn hơn hoặc bằng giá trị tuyệt đối của test_stat.