1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

Bài tập

Thống kê kiểm định và kích thước hiệu ứng

Làm thế nào để bạn khám phá mối quan hệ tuyến tính bằng bootstrap resampling? Quay lại đường mòn thôi! Với mỗi chuyến đi bộ đường dài được vẽ thành một điểm, bạn có thể thấy có một mối quan hệ tuyến tính giữa tổng quãng đường đã đi và thời gian trôi qua. Nếu xem quãng đường đã đi như một "hiệu ứng" của thời gian, thì bạn có thể khám phá mối liên hệ cơ bản giữa hồi quy tuyến tính và suy luận thống kê.

Trong bài tập này, bạn sẽ tách dữ liệu thành hai quần thể, hay "nhóm": thời điểm sớm và thời điểm muộn. Sau đó, bạn sẽ xem xét chênh lệch giữa tổng quãng đường đã đi trong mỗi quần thể. Chênh lệch này sẽ đóng vai trò là một "thống kê kiểm định", và phân phối của nó sẽ kiểm định hiệu ứng của việc tách quãng đường theo thời điểm.

ch04_ex11_fig03.png

Hướng dẫn

100 XP
  • Dùng "logical indexing" của numpy, ví dụ sample_distances[sample_times < 5], để tách distances mẫu thành hai nhóm thời điểm sớm và muộn.
  • Dùng np.random.choice() với replacement=True để tạo một resample cho mỗi trong hai khoảng thời gian.
  • Tính mảng test_statistic là resample_long - resample_short, rồi tìm và in kích thước hiệu ứng và độ bất định bằng np.mean(), np.std().
  • Vẽ phân phối của test_statistic, sử dụng đối tượng dựng sẵn fig = plot_test_statistic().