1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong R

Connected

Bài tập

Khoảng percentile bằng bootstrap

Ý chính ở bài trước là khoảng cách giữa mẫu gốc \(\hat{p}\) và các giá trị \(\hat{p}^*\) lấy mẫu lại (bootstrap) cho ta thước đo về việc \(\hat{p}\) gốc lệch bao nhiêu so với tỷ lệ dân số thật.

Cũng có thể đo lường cùng mức độ biến thiên này theo một cách khác. Như trước, nếu \(\hat{p}\) đủ gần tham số thật, thì các giá trị \(\hat{p}^*\) lấy mẫu lại sẽ biến thiên theo cách sao cho chúng chồng lấp với tham số thật.

Thay vì dùng \(\pm 2 SE\) để đo 95% trung tâm của các giá trị \(\hat{p}\) lấy mẫu, bạn có thể tìm phần giữa của các giá trị \(\hat{p}^*\) bằng cách loại bỏ 2,5% phía dưới và 2,5% phía trên. Lưu ý rằng cách thứ hai để dựng khoảng bootstrap này cũng cho một cách trực quan để tạo khoảng tin cậy 90% hoặc 99% cũng như 95%.

Các mẫu bootstrap, one_poll_boot, và tỷ lệ phiếu “đồng ý”, p_hat, đã có trong workspace của bạn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Chạy mã để nhắc lại khoảng t từ bài trước.
    • Tính khoảng 95 phần trăm của các giá trị \(\hat{p}^*\) bootstrap nằm trong one_poll_boot.
      • Tóm tắt để tính đầu mút dưới tại bách phân vị 2,5% của stat bằng cách đặt p thành 0.025.
      • Tính đầu mút trên theo cách tương tự.
  • 2

    Thực hiện phép tính tương tự bằng hàm tiện lợi của infer, get_confidence_interval(). Với khoảng, dùng level = 0.95, và đặt tên đầu ra là percentile_ci.

  • 3
    • visualize() phân phối các tỷ lệ bootstrap với 95 phần trăm ở giữa được làm nổi bật.
      • Đặt endpoints của vùng được tô sáng là percentile_ci.
      • Đặt direction là "between" để tô sáng phần giữa hai đầu mút đó.