1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Bootstrapping khoảng tin cậy

Sau khi đã bootstrapping phân phối của hệ số hiệu ứng-nữ ở bài trước, giờ bạn có thể dùng nó để ước lượng khoảng tin cậy. Khoảng này cho phép bạn đưa ra đánh giá về dữ liệu như sau: "Với mức bất định do nội suy, chúng ta chắc 95% rằng hiệu ứng-nữ lên thu nhập nằm giữa a và b", trong đó a và b là cận dưới và cận trên của khoảng.

Ở bài trước, bạn đã chạy bootstrapping với R = 50 lần lặp. Tuy nhiên, trong hầu hết ứng dụng, con số này là chưa đủ. Trong bài này, bạn có thể dùng boot_results đã được chuẩn bị sẵn với 1000 lần lặp. Trước hết, bạn sẽ xem phân phối bootstrapped để kiểm tra xem nó có trông gần chuẩn không. Nếu có, bạn có thể dựa vào phân phối chuẩn để tính khoảng tin cậy.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • plot() và print() kết quả bootstrapping, boot_results.