1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Suy luận trong R

Connected

Bài tập

Quy tắc kinh nghiệm (Empirical Rule)

Nhiều thống kê dùng trong phân tích dữ liệu (bao gồm cả trung bình mẫu và tỷ lệ mẫu) có những tính chất hữu ích giúp bạn hiểu rõ hơn về (các) tham số của tổng thể mà bạn quan tâm.

Một tính chất như vậy là: nếu độ biến thiên của tỷ lệ mẫu (gọi là sai số chuẩn hay \(SE\)) đã biết, thì xấp xỉ 95% các giá trị \(\hat{p}\) (từ các mẫu khác nhau) sẽ nằm trong phạm vi \(2SE\) quanh tỷ lệ tổng thể đúng.

Để kiểm tra điều đó có đúng trong tình huống hiện tại hay không, hãy quay lại các cuộc thăm dò được tạo bằng cách lấy nhiều mẫu từ cùng một tổng thể.

Bộ dữ liệu all_polls chứa 1000 mẫu kích thước 30 từ một tổng thể có xác suất bỏ phiếu cho Ứng viên X bằng 0.6.

Lưu ý bạn sẽ dùng hàm R sd() để tính độ biến thiên của một tập số. Trong thống kê, khi sd() áp dụng cho một biến (ví dụ: giá nhà) ta gọi đó là độ lệch chuẩn. Khi sd() áp dụng cho một thống kê (ví dụ: tập các tỷ lệ mẫu) ta gọi đó là sai số chuẩn.

Hướng dẫn

100 XP
  • Chạy mã để tạo props, tỷ lệ những người dự định bỏ phiếu yes trong mỗi cuộc thăm dò. Việc này dựa trên ex1_props từ các bài trước.
  • Thêm một cột is_in_conf_int có giá trị TRUE khi tỷ lệ yes lấy mẫu cách tỷ lệ yes của tổng thể thật ít hơn 2 sai số chuẩn. Tức là, độ chênh abs() giữa prop_yes và true_prop_yes nhỏ hơn hai lần sd() của prop_yes.
  • Tính tỷ lệ các thống kê mẫu nằm trong khoảng tin cậy, prop_in_conf_int, bằng cách lấy mean() của is_in_conf_int.