Aan de slagGa gratis aan de slag

NHANES-gegevensset samenstellen

Zoals gedownload van de NHANES-website, zijn de NHANES-gegevenssets alleen beschikbaar als afzonderlijke .XPT-bestanden, een eigen formaat van SAS. Gelukkig bestaat het haven-pakket.

Laten we de NHANES Demographics-, Medical Conditions- en Body Measures-gegevenssets combineren, beschikbaar in hun ruwe .XPT-formaat en te benaderen via de variabelen DEMO_file, MCQ_file en BMX_file. Voeg alle 3 gegevenssets samen met de variabele SEQN. Een goede manier om dit te doen is met Reduce(), waarmee je elementen handig kunt combineren.

De joins-code, die voor je is meegegeven, doet het volgende:

  • Maakt een lijst van alle 3 gegevenssets (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Gebruikt een aangepaste functie binnen Reduce() om alle 3 gegevenssets inner te joinen met de variabele "SEQN".
  • Slaat dit op als de gegevensset nhanes_combined.

Deze oefening maakt deel uit van de cursus

Experimenteel ontwerp in R

Cursus bekijken

Oefeninstructies

  • Laad het haven-pakket.
  • Importeer de drie databestanden met aparte aanroepen naar read_xpt(), waarbij de inputs voor deze 3 aanroepen DEMO_file, MCQ_file en BMX_file zijn, en sla ze respectievelijk op als de gegevenssets nhanes_demo, nhanes_medical en nhanes_bodymeasures.
  • Maak nhanes_combined door de 3 zojuist geïmporteerde gegevenssets te mergen met de meegeleverde code.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load haven
___

# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___

# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
  Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)
Code bewerken en uitvoeren