NHANES-gegevensset samenstellen
Zoals gedownload van de NHANES-website, zijn de NHANES-gegevenssets alleen beschikbaar als afzonderlijke .XPT-bestanden, een eigen formaat van SAS. Gelukkig bestaat het haven-pakket.
Laten we de NHANES Demographics-, Medical Conditions- en Body Measures-gegevenssets combineren, beschikbaar in hun ruwe .XPT-formaat en te benaderen via de variabelen DEMO_file, MCQ_file en BMX_file. Voeg alle 3 gegevenssets samen met de variabele SEQN. Een goede manier om dit te doen is met Reduce(), waarmee je elementen handig kunt combineren.
De joins-code, die voor je is meegegeven, doet het volgende:
- Maakt een lijst van alle 3 gegevenssets (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Gebruikt een aangepaste functie binnen
Reduce()om alle 3 gegevenssets inner te joinen met de variabele"SEQN". - Slaat dit op als de gegevensset
nhanes_combined.
Deze oefening maakt deel uit van de cursus
Experimenteel ontwerp in R
Oefeninstructies
- Laad het
haven-pakket. - Importeer de drie databestanden met aparte aanroepen naar
read_xpt(), waarbij de inputs voor deze 3 aanroepenDEMO_file,MCQ_fileenBMX_filezijn, en sla ze respectievelijk op als de gegevenssetsnhanes_demo,nhanes_medicalennhanes_bodymeasures. - Maak
nhanes_combineddoor de 3 zojuist geïmporteerde gegevenssets te mergen met de meegeleverde code.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)