NHANES-Datensatz zusammenstellen
So wie sie von der NHANES-Website heruntergeladen werden, liegen die NHANES-Datensätze nur als separate .XPT-Dateien vor, dem nativen Format von SAS. Zum Glück gibt es das Paket haven.
Lass uns die NHANES-Datensätze Demographics, Medical Conditions und Body Measures kombinieren. Sie liegen im ursprünglichen .XPT-Format vor und sind über die Variablen DEMO_file, MCQ_file und BMX_file zugänglich. Füge alle 3 Datensätze über die Variable SEQN zusammen. Eine gute Methode dafür ist Reduce(), womit du Elemente praktisch zusammenführen kannst.
Der bereitgestellte Join-Code macht Folgendes:
- Erstellt eine Liste aller 3 Datensätze (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Verwendet eine benutzerdefinierte Funktion innerhalb von
Reduce(), um alle 3 Datensätze per Inner Join mit der Variable"SEQN"zu verknüpfen. - Speichert das Ergebnis als Datensatz
nhanes_combined.
Diese Übung ist Teil des Kurses
Versuchsplanung in R
Anleitung zur Übung
- Lade das Paket
haven. - Importiere die drei Datendateien mit separaten Aufrufen von
read_xpt(). Die Eingaben für diese 3 Aufrufe vonread_xpt()sindDEMO_file,MCQ_fileundBMX_file. Speichere sie als Datensätzenhanes_demo,nhanes_medicalundnhanes_bodymeasures. - Erstelle
nhanes_combined, indem du die 3 soeben importierten Datensätze mit dem bereitgestellten Code zusammenführst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)