Construcción del conjunto de datos NHANES
Tal como se descargan desde el sitio web de NHANES, los conjuntos de datos de NHANES solo están disponibles como archivos .XPT, un formato nativo de SAS. Por suerte, tenemos el paquete haven.
Vamos a combinar los conjuntos de datos de NHANES de Demographics, Medical Conditions y Body Measures, disponibles en su formato .XPT bruto y accesibles a través de las variables DEMO_file, MCQ_file y BMX_file. Une los 3 conjuntos de datos usando la variable SEQN. Una buena forma de hacerlo es con Reduce(), que te permite combinar elementos de manera útil.
El código de unión, que se te proporciona, hace lo siguiente:
- Crea una lista con los 3 conjuntos de datos (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Usa una función personalizada dentro de
Reduce()para hacer un inner join de los 3 conjuntos de datos con la variable"SEQN". - Guarda el resultado como el conjunto de datos
nhanes_combined.
Este ejercicio forma parte del curso
Diseño experimental en R
Instrucciones del ejercicio
- Carga el paquete
haven. - Importa los tres archivos de datos con llamadas separadas a
read_xpt(), donde las entradas de estas 3 llamadas aread_xpt()sonDEMO_file,MCQ_fileyBMX_file, y guarda los resultados comonhanes_demo,nhanes_medicalynhanes_bodymeasures, respectivamente. - Crea
nhanes_combineduniendo los 3 conjuntos de datos que acabas de importar, usando el código proporcionado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)