1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lấy mẫu trong R

Connected

Bài tập

Lấy mẫu ngẫu nhiên đơn giản

Phương pháp đơn giản nhất để lấy mẫu từ một quần thể chính là cách bạn vừa thấy. Nó được gọi là lấy mẫu ngẫu nhiên đơn giản (đôi khi viết tắt là "SRS"), và bao gồm việc chọn ngẫu nhiên từng hàng, lần lượt, trong đó mỗi hàng có cùng xác suất được chọn như nhau.

Để dễ xem hàng nào rơi vào mẫu, sẽ hữu ích nếu thêm một cột ID hàng vào dữ liệu trước khi bạn lấy mẫu.

Trong chương này, chúng ta sẽ xem các phương pháp lấy mẫu bằng một bộ dữ liệu giả lập về thôi việc của nhân viên từ IBM, trong đó "attrition" nghĩa là rời công ty.

attrition_pop đã sẵn có; dplyr đã được nạp.

Hướng dẫn

100 XP
  • Xem bộ dữ liệu attrition_pop. Khám phá trong trình xem cho đến khi bạn nắm rõ nội dung của nó.
  • Đặt hạt giống ngẫu nhiên (random seed) thành một giá trị bạn chọn.
  • Thêm một cột ID hàng vào dữ liệu, sau đó dùng lấy mẫu ngẫu nhiên đơn giản để lấy 200 hàng.
  • Xem bộ dữ liệu mẫu, attrition_samp. Bạn nhận thấy gì về các ID hàng?