Lấy mẫu lại từ một mẫu

Để tìm hiểu mức độ ước lượng tỷ lệ của quần thể thay đổi giữa các mẫu, bạn sẽ thiết lập hai thí nghiệm lấy mẫu.

Trong thí nghiệm đầu tiên, bạn sẽ mô phỏng việc lấy lặp lại nhiều mẫu từ một quần thể. Ở thí nghiệm thứ hai, bạn sẽ chọn một mẫu duy nhất từ thí nghiệm đầu và liên tục lấy mẫu lại từ chính mẫu đó: phương pháp gọi là bootstrapping. Cụ thể:

Thí nghiệm 1: Giả sử tỷ lệ thực sự của những người sẽ bỏ phiếu cho Ứng viên X là 0.6. Liên tục lấy mẫu 30 người từ quần thể và đo lường độ biến thiên của \(\hat{p}\) (tỷ lệ trong mẫu).

Thí nghiệm 2: Lấy một mẫu cỡ 30 từ cùng quần thể. Liên tục lấy 30 người (có hoàn lại!) từ mẫu ban đầu và đo lường độ biến thiên của \(\hat{p}^*\) (tỷ lệ trong mẫu lấy lại).

Điều quan trọng là thí nghiệm thứ nhất phụ thuộc vào việc biết toàn bộ quần thể và trên thực tế thường không khả thi. Thí nghiệm thứ hai chỉ dựa vào mẫu dữ liệu nên dễ áp dụng cho bất kỳ thống kê nào. May mắn là, như bạn sẽ thấy, độ biến thiên của \(\hat{p}\), tức tỷ lệ "thành công" trong một mẫu, xấp xỉ như nhau dù ta lấy mẫu từ quần thể hay lấy mẫu lại từ một mẫu.

Chúng tôi đã tạo 1000 mẫu ngẫu nhiên, mỗi mẫu cỡ 30, từ quần thể. Data frame all_polls đã có sẵn trong môi trường làm việc của bạn. Hãy xem qua trước khi bắt đầu.

Tính tỷ lệ mẫu cho từng mẫu ban đầu trong 1000 mẫu, gán vào ex1_props.
- Group theo poll.
- Tóm tắt để tính stat là mean() của các trường hợp vote bằng "yes".

Bài tập

Lấy mẫu lại từ một mẫu

Hướng dẫn 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn 1/3

Bài tập