Costruzione del dataset NHANES
Scaricati dal sito NHANES, i dataset NHANES sono disponibili solo come file .XPT, un formato nativo di SAS. Per fortuna esiste il pacchetto haven.
Combiniamo i dataset NHANES Demographics, Medical Conditions e Body Measures, disponibili nel loro formato grezzo .XPT e accessibili tramite le variabili DEMO_file, MCQ_file e BMX_file. Unisci tutti e 3 i dataset usando la variabile SEQN. Un buon modo per farlo è usare Reduce(), che ti permette di combinare gli elementi in modo efficace.
Il codice di join, già fornito, fa quanto segue:
- Crea una lista di tutti e 3 i dataset (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Usa una funzione personalizzata all'interno di
Reduce()per fare un inner join di tutti e 3 i dataset con la variabile"SEQN". - Salva il risultato come dataset
nhanes_combined.
Questo esercizio fa parte del corso
Progettazione Sperimentale in R
Istruzioni dell'esercizio
- Carica il pacchetto
haven. - Importa i tre file di dati con chiamate separate a
read_xpt(), in cui gli input di queste 3 chiamate aread_xpt()sonoDEMO_file,MCQ_fileeBMX_file, e salvali rispettivamente come datasetnhanes_demo,nhanes_medicalenhanes_bodymeasures. - Crea
nhanes_combinedunendo i 3 dataset appena importati, usando il codice fornito.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)