CommencerCommencer gratuitement

Construction du jeu de données NHANES

Tels que téléchargés depuis le site NHANES, les jeux de données NHANES ne sont disponibles que sous forme de fichiers .XPT, un format natif de SAS. Heureusement, le package haven existe.

Combinons les jeux de données NHANES Demographics, Medical Conditions et Body Measures, disponibles dans leur format .XPT brut et accessibles via les variables DEMO_file, MCQ_file et BMX_file. Joignez les 3 jeux de données à l’aide de la variable SEQN. Une bonne façon de procéder est d’utiliser Reduce(), qui permet de combiner des éléments de manière efficace.

Le code de jointure fourni réalise les actions suivantes :

  • Crée une liste des 3 jeux de données (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Utilise une fonction personnalisée dans Reduce() pour faire une jointure interne des 3 jeux de données sur la variable "SEQN".
  • Enregistre le résultat dans le jeu de données nhanes_combined.

Cet exercice fait partie du cours

Plan d’expériences en R

Afficher le cours

Instructions

  • Chargez le package haven.
  • Importez les trois fichiers de données avec des appels séparés à read_xpt(), en utilisant comme entrées DEMO_file, MCQ_file et BMX_file, et enregistrez-les respectivement sous les noms nhanes_demo, nhanes_medical et nhanes_bodymeasures.
  • Créez nhanes_combined en fusionnant les 3 jeux de données que vous venez d’importer, en utilisant le code fourni.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load haven
___

# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___

# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
  Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)
Modifier et exécuter le code