1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Tương quan giữa dữ liệu con và bố mẹ

Để định lượng mức độ tương quan giữa độ sâu mỏ của con non và bố mẹ, chúng ta muốn tính các thống kê như hệ số tương quan Pearson giữa bố mẹ và con cái. Để có khoảng tin cậy cho đại lượng này, ta cần thực hiện pairs bootstrap.

Bạn đã viết một hàm để thực hiện pairs bootstrap nhằm ước tính các tham số rút ra từ hồi quy tuyến tính. Nhiệm vụ trong bài này là viết một hàm mới với chữ ký lời gọi draw_bs_pairs(x, y, func, size=1) để thực hiện pairs bootstrap và tính một thống kê duy nhất trên các mẫu cặp đã xác định. Thống kê quan tâm được tính bằng cách gọi func(bs_x, bs_y). Ở bài tiếp theo, bạn sẽ dùng pearson_r cho func.

Hướng dẫn

100 XP
  • Tạo một mảng các chỉ số để lấy mẫu. (Nhớ rằng, khi làm pairs bootstrap, ta chọn ngẫu nhiên các chỉ số và dùng chúng để lấy các cặp.)
  • Khởi tạo mảng các bootstrap replicate. Đây phải là mảng một chiều có độ dài size.
  • Viết vòng lặp for để rút mẫu.
  • Chọn ngẫu nhiên các chỉ số từ mảng chỉ số bạn đã tạo ở bước trước.
  • Trích xuất các giá trị x và y từ mảng đầu vào bằng các chỉ số vừa chọn để tạo một bootstrap sample.
  • Dùng func để tính thống kê quan tâm từ các bootstrap sample của x và y và lưu nó vào mảng bootstrap replicates của bạn.
  • Trả về mảng bootstrap replicates.