IniziaInizia gratis

Costruzione del dataset NHANES

Scaricati dal sito NHANES, i dataset NHANES sono disponibili solo come file .XPT, un formato nativo di SAS. Per fortuna esiste il pacchetto haven.

Combiniamo i dataset NHANES Demographics, Medical Conditions e Body Measures, disponibili nel loro formato grezzo .XPT e accessibili tramite le variabili DEMO_file, MCQ_file e BMX_file. Unisci tutti e 3 i dataset usando la variabile SEQN. Un buon modo per farlo è usare Reduce(), che ti permette di combinare gli elementi in modo efficace.

Il codice di join, già fornito, fa quanto segue:

  • Crea una lista di tutti e 3 i dataset (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Usa una funzione personalizzata all'interno di Reduce() per fare un inner join di tutti e 3 i dataset con la variabile "SEQN".
  • Salva il risultato come dataset nhanes_combined.

Questo esercizio fa parte del corso

Progettazione Sperimentale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto haven.
  • Importa i tre file di dati con chiamate separate a read_xpt(), in cui gli input di queste 3 chiamate a read_xpt() sono DEMO_file, MCQ_file e BMX_file, e salvali rispettivamente come dataset nhanes_demo, nhanes_medical e nhanes_bodymeasures.
  • Crea nhanes_combined unendo i 3 dataset appena importati, usando il codice fornito.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load haven
___

# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___

# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
  Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)
Modifica ed esegui il codice