Pengambilan Sampel Ulang Data NHANES
Data NHANES dikumpulkan dari unit sampel (orang) yang dipilih khusus untuk mewakili populasi AS. Namun, mari kita ambil sampel ulang himpunan data nhanes_final dengan berbagai cara agar Anda memahami perbedaan metode pengambilan sampel.
Kita dapat melakukan simple random sampling menggunakan slice_sample() dari dplyr. Fungsi ini menerima masukan berupa himpunan data dan sebuah bilangan bulat yang menyatakan jumlah baris yang akan diambil sampelnya.
Stratified sampling dapat dilakukan dengan menggabungkan group_by() dan slice_sample(). Fungsi ini akan mengambil sampel n dari tiap kelompok yang ditentukan di group_by().
Fungsi cluster() dari paket sampling membuat cluster sample. Fungsi ini menerima nama himpunan data, variabel dalam himpunan data yang akan digunakan sebagai variabel klaster (diberikan sebagai vektor dengan nama dalam bentuk string, misalnya c("variable")), jumlah klaster yang akan dipilih, dan metodenya.
Latihan ini adalah bagian dari kursus
Perancangan Eksperimen di R
Petunjuk latihan
- Gunakan
slice_sample()untuk memilih 2500 observasi darinhanes_finaldan simpan sebagainhanes_srs. - Buat
nhanes_stratifieddengan menggunakangroup_by()danslice_sample(). Lakukan stratifikasi berdasarkanriagendrdan pilih 2000 untuk setiap gender. Konfirmasikan bahwa ini berhasil dengan menggunakancount()untuk memeriksa variabel gender padanhanes_stratified. - Muat paket
sampling. Gunakancluster()untuk membaginhanes_finalberdasarkan"indhhin2"menjadi 6 klaster dengan metode"srswor". Tetapkan kenhanes_cluster.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use slice_sample() to create nhanes_srs
nhanes_srs <- ___ %>% ___(n=___)
# Create nhanes_stratified with group_by() and slice_sample()
___ <- ___ %>% group_by(___) %>% ___(n=___)
nhanes_stratified %>% ___
# Load sampling package and create nhanes_cluster with cluster()
___
nhanes_cluster <- cluster(___, "___", 6, method = "srswor")