Construction du jeu de données NHANES
Tels que téléchargés depuis le site NHANES, les jeux de données NHANES ne sont disponibles que sous forme de fichiers .XPT, un format natif de SAS. Heureusement, le package haven existe.
Combinons les jeux de données NHANES Demographics, Medical Conditions et Body Measures, disponibles dans leur format .XPT brut et accessibles via les variables DEMO_file, MCQ_file et BMX_file. Joignez les 3 jeux de données à l’aide de la variable SEQN. Une bonne façon de procéder est d’utiliser Reduce(), qui permet de combiner des éléments de manière efficace.
Le code de jointure fourni réalise les actions suivantes :
- Crée une liste des 3 jeux de données (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Utilise une fonction personnalisée dans
Reduce()pour faire une jointure interne des 3 jeux de données sur la variable"SEQN". - Enregistre le résultat dans le jeu de données
nhanes_combined.
Cet exercice fait partie du cours
Plan d’expériences en R
Instructions
- Chargez le package
haven. - Importez les trois fichiers de données avec des appels séparés à
read_xpt(), en utilisant comme entréesDEMO_file,MCQ_fileetBMX_file, et enregistrez-les respectivement sous les nomsnhanes_demo,nhanes_medicaletnhanes_bodymeasures. - Créez
nhanes_combineden fusionnant les 3 jeux de données que vous venez d’importer, en utilisant le code fourni.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)