1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Suy luận cho dữ liệu phân loại trong R

Connected

Bài tập

Xây dựng khoảng tin cậy (CI)

Bạn đã thấy một ví dụ về cách p-hat thay đổi khi lấy mẫu lại, nhưng chúng ta cần làm việc này thật nhiều lần để ước lượng tốt mức độ biến thiên của nó. Ở đây bạn sẽ tính toàn bộ phân phối bootstrap để ước lượng sai số chuẩn (SE) dùng để lập khoảng tin cậy. Bạn sẽ dùng thêm một động từ trong infer, calculate(), để tối ưu quy trình tính nhiều thống kê từ nhiều bộ dữ liệu.

Hãy dành chút thời gian xem đầu ra của calculate. Hàm này rút gọn data frame của bạn chỉ còn hai cột: một cột cho các "stat" và một cột cho "replicate" tương ứng.

Khi vẽ phân phối bootstrap, bạn sẽ thấy nó có dạng chuông. Chính hình dạng này cho phép bạn cộng và trừ hai lần SE để được khoảng 95%.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tạo một phân phối bootstrap tên boot_dist theo các bước sau:
  • specify rằng bạn quan tâm đến biến consci với thành công được xác định bởi mức tự tin "High".
  • generate 500 bản sao bootstrap.
  • calculate thống kê tỉ lệ bằng cách đặt stat là "prop".