Konstruksi himpunan data NHANES
Seperti diunduh dari situs web NHANES, himpunan data NHANES hanya tersedia sebagai berkas .XPT terpisah, format asli SAS. Untungnya, paket haven tersedia.
Mari gabungkan himpunan data Demographics, Medical Conditions, dan Body Measures dari NHANES, yang tersedia dalam format mentah .XPT dan dapat diakses melalui variabel DEMO_file, MCQ_file, dan BMX_file. Gabungkan ketiga himpunan data tersebut menggunakan variabel SEQN. Cara yang baik untuk melakukan ini adalah menggunakan Reduce(), yang memungkinkan Anda menggabungkan elemen dengan cara yang bermanfaat.
Kode penggabungan yang disediakan untuk Anda melakukan hal-hal berikut:
- Membuat daftar dari ketiga himpunan data (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Menggunakan fungsi kustom di dalam
Reduce()untuk melakukan inner join pada ketiga himpunan data dengan variabel"SEQN". - Menyimpannya sebagai himpunan data
nhanes_combined.
Latihan ini adalah bagian dari kursus
Perancangan Eksperimen di R
Petunjuk latihan
- Muat paket
haven. - Impor ketiga berkas data dengan pemanggilan terpisah ke
read_xpt(), dengan masukan untuk 3 pemanggilanread_xpt()tersebut adalahDEMO_file,MCQ_file, danBMX_file, lalu simpan sebagai himpunan datanhanes_demo,nhanes_medical, dannhanes_bodymeasuressecara berurutan. - Buat
nhanes_combineddengan menggabungkan ketiga himpunan data yang baru Anda impor, menggunakan kode yang disediakan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)