Pengambilan sampel acak sederhana
Metode paling sederhana untuk mengambil sampel dari suatu populasi adalah yang sudah Anda lihat sebelumnya. Metode ini dikenal sebagai simple random sampling (kadang disingkat "SRS"), dan melibatkan pemilihan baris secara acak, satu per satu, di mana setiap baris memiliki peluang yang sama untuk terpilih seperti baris lainnya.
Agar lebih mudah melihat baris mana yang masuk ke dalam sampel, akan membantu jika Anda menambahkan kolom ID baris pada himpunan data sebelum mengambil sampel.
Dalam bab ini, kita akan melihat metode pengambilan sampel menggunakan himpunan data sintetis (fiktif) tentang atrisi karyawan dari IBM, di mana "attrition" berarti keluar dari perusahaan.
attrition_pop tersedia; dplyr sudah dimuat.
Latihan ini adalah bagian dari kursus
Sampling di R
Petunjuk latihan
- Lihat himpunan data
attrition_pop. Jelajahi di penampil hingga Anda paham isinya. - Atur seed acak ke nilai pilihan Anda.
- Tambahkan kolom ID baris ke himpunan data, lalu gunakan simple random sampling untuk mengambil 200 baris.
- Lihat himpunan data sampel,
attrition_samp. Apa yang Anda perhatikan tentang ID barisnya?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View the attrition_pop dataset
___
# Set the seed
___
attrition_samp <- attrition_pop %>%
# Add a row ID column
___ %>%
# Get 200 rows using simple random sampling
___
# View the attrition_samp dataset
___