1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 2)

Connected

Bài tập

Hàm thực hiện pairs bootstrap

Như đã thảo luận trong video, pairs bootstrap là tái lấy mẫu theo cặp dữ liệu. Mỗi tập hợp cặp được fit bằng một đường thẳng, trong trường hợp này dùng np.polyfit(). Ta lặp lại việc này nhiều lần để thu được các bản sao bootstrap của các giá trị tham số. Để có một công cụ hữu ích cho pairs bootstrap, bạn sẽ viết một hàm thực hiện pairs bootstrap trên một tập dữ liệu x,y.

Hướng dẫn

100 XP
  • Định nghĩa một hàm với chữ ký gọi draw_bs_pairs_linreg(x, y, size=1) để thực hiện ước lượng pairs bootstrap cho các tham số hồi quy tuyến tính.
    • Dùng np.arange() để tạo một mảng chỉ số từ 0 đến len(x). Đây là những gì bạn sẽ tái lấy mẫu và dùng để chọn giá trị từ các mảng x và y.
    • Dùng np.empty() để khởi tạo các mảng bản sao cho hệ số góc và hệ số chặn có kích thước size.
    • Viết một vòng lặp for để:
      • Tái lấy mẫu các chỉ số inds. Dùng np.random.choice() để thực hiện.
      • Tạo các mảng \(x\) và \(y\) mới bs_x và bs_y bằng các chỉ số đã tái lấy mẫu bs_inds. Để làm vậy, hãy cắt x và y với bs_inds.
      • Dùng np.polyfit() trên các mảng \(x\) và \(y\) mới và lưu hệ số góc và hệ số chặn tính được.
    • Trả về các bản sao pairs bootstrap của hệ số góc và hệ số chặn.