1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Kiểm định giả thuyết bootstrap hai mẫu cho chênh lệch trung bình

Giờ chúng ta muốn kiểm định giả thuyết rằng Frog A và Frog B có cùng trung bình lực va chạm, nhưng không nhất thiết có cùng phân phối — điều này cũng không thể làm được với kiểm định hoán vị.

Để thực hiện kiểm định bootstrap hai mẫu, ta dịch cả hai mảng để chúng có cùng trung bình, vì ta đang mô phỏng giả thuyết rằng trung bình của chúng thực sự bằng nhau. Sau đó, ta lấy mẫu bootstrap từ các mảng đã dịch và tính chênh lệch trung bình. Mỗi lần như vậy tạo thành một bootstrap replicate, và ta sinh ra rất nhiều replicate. p-value là tỷ lệ replicate có chênh lệch trung bình lớn hơn hoặc bằng giá trị quan sát được.

Các đối tượng forces_concat và empirical_diff_means đã có sẵn trong không gian tên của bạn.

Hướng dẫn

100 XP
  • Tính trung bình của toàn bộ lực (từ forces_concat) bằng np.mean().
  • Tạo bộ dữ liệu đã dịch cho cả force_a và force_b sao cho trung bình của mỗi mảng bằng trung bình của mảng lực va chạm đã nối.
  • Tạo 10.000 bootstrap replicates của trung bình cho mỗi mảng đã dịch.
  • Tính các bootstrap replicates của chênh lệch trung bình bằng cách lấy replicate của lực va chạm đã dịch của Frog A trừ đi replicate của Frog B.
  • Tính và in ra p-value từ các bootstrap replicates của bạn.