1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

Bài tập

Trực quan hóa thống kê kiểm định

Trong bài tập này, bạn sẽ tiếp cận giả thuyết không bằng cách so sánh phân phối của một thống kê kiểm định được tạo ra theo hai cách khác nhau.

Đầu tiên, bạn sẽ xem xét hai "quần thể", được nhóm theo thời điểm sớm và muộn, và tính phân phối của thống kê kiểm định. Tiếp theo, xáo trộn hai quần thể này để dữ liệu không còn theo thứ tự thời gian nữa và mỗi quần thể có trộn cả thời điểm sớm và muộn, rồi tính lại phân phối của thống kê kiểm định.

Để bạn bắt đầu, chúng tôi đã nạp sẵn hai nhóm thời lượng, group_duration_short và group_duration_long, cùng hai hàm shuffle_and_split() và plot_test_statistic().

Hướng dẫn

100 XP
  • Dùng np.random.choice() để lấy mẫu lại group_duration_short và group_duration_long, rồi lấy hiệu giữa các mẫu để tính test_statistic_unshuffled.
  • Dùng shuffle_and_split() trên group_duration_short và group_duration_long (theo đúng thứ tự này) để tạo hai quần thể trộn mới.
  • Lấy mẫu lại từ các quần thể đã xáo trộn, và trừ resample_short khỏi resample_long để tính test_statistic_shuffled mới.
  • Dùng plot_test_statistic() để vẽ cả hai phân phối thống kê kiểm định và so sánh trực quan.