Khoảng percentile bằng bootstrap

Ý chính ở bài trước là khoảng cách giữa mẫu gốc \(\hat{p}\) và các giá trị \(\hat{p}^*\) lấy mẫu lại (bootstrap) cho ta thước đo về việc \(\hat{p}\) gốc lệch bao nhiêu so với tỷ lệ dân số thật.

Cũng có thể đo lường cùng mức độ biến thiên này theo một cách khác. Như trước, nếu \(\hat{p}\) đủ gần tham số thật, thì các giá trị \(\hat{p}^*\) lấy mẫu lại sẽ biến thiên theo cách sao cho chúng chồng lấp với tham số thật.

Thay vì dùng \(\pm 2 SE\) để đo 95% trung tâm của các giá trị \(\hat{p}\) lấy mẫu, bạn có thể tìm phần giữa của các giá trị \(\hat{p}^*\) bằng cách loại bỏ 2,5% phía dưới và 2,5% phía trên. Lưu ý rằng cách thứ hai để dựng khoảng bootstrap này cũng cho một cách trực quan để tạo khoảng tin cậy 90% hoặc 99% cũng như 95%.

Các mẫu bootstrap, one_poll_boot, và tỷ lệ phiếu “đồng ý”, p_hat, đã có trong workspace của bạn.

1
- Chạy mã để nhắc lại khoảng t từ bài trước.
- Tính khoảng 95 phần trăm của các giá trị \(\hat{p}^*\) bootstrap nằm trong one_poll_boot.
  
  Tóm tắt để tính đầu mút dưới tại bách phân vị 2,5% của stat bằng cách đặt p thành 0.025.
  
  Tính đầu mút trên theo cách tương tự.

2
Thực hiện phép tính tương tự bằng hàm tiện lợi của infer, get_confidence_interval(). Với khoảng, dùng level = 0.95, và đặt tên đầu ra là percentile_ci.
3
- visualize() phân phối các tỷ lệ bootstrap với 95 phần trăm ở giữa được làm nổi bật.
  
  Đặt endpoints của vùng được tô sáng là percentile_ci.
  
  Đặt direction là "between" để tô sáng phần giữa hai đầu mút đó.

Bài tập

Khoảng percentile bằng bootstrap

Hướng dẫn 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn 1/3

Bài tập