1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Kiểm định giả thuyết: Mỏ sâu hơn vào năm 2012?

Biểu đồ ECDF và khoảng tin cậy bạn đã tính cho thấy khá rõ rằng mỏ của G. scandens ở đảo Daphne Major đã sâu hơn. Nhưng liệu có thể hiệu ứng này chỉ do ngẫu nhiên? Nói cách khác, xác suất để chúng ta quan sát được chênh lệch trung bình độ sâu mỏ như vậy nếu hai trung bình thực sự bằng nhau là bao nhiêu?

Lưu ý! Giả thuyết đang kiểm định không phải là hai phân phối độ sâu mỏ giống nhau. Với giả thuyết đó, ta có thể dùng kiểm định hoán vị (permutation test). Ở đây, giả thuyết là hai giá trị trung bình bằng nhau. Để thực hiện kiểm định này, ta cần dịch hai bộ dữ liệu sao cho chúng có cùng trung bình, rồi dùng bootstrap để lấy mẫu và tính hiệu giữa hai trung bình.

Hướng dẫn

100 XP
  • Tạo một mảng nối giữa độ sâu mỏ năm 1975 và 2012, rồi tính và lưu trung bình của mảng này.
  • Dịch bd_1975 và bd_2012 sao cho trung bình của mỗi mảng bằng với trung bình bạn vừa tính cho dữ liệu gộp.
  • Lấy 10.000 bootstrap replicates của trung bình cho mỗi bộ độ sâu mỏ năm 1975 và 2012.
  • Trừ replicates của 1975 khỏi replicates của 2012 để thu được bootstrap replicates của hiệu.
  • Tính và in ra p-value. Chênh lệch trung bình quan sát được bạn đã tính ở bài trước vẫn còn trong không gian tên dưới biến mean_diff.