ComenzarEmpieza gratis

Construcción del conjunto de datos NHANES

Tal como se descargan desde el sitio web de NHANES, los conjuntos de datos de NHANES solo están disponibles como archivos .XPT, un formato nativo de SAS. Por suerte, tenemos el paquete haven.

Vamos a combinar los conjuntos de datos de NHANES de Demographics, Medical Conditions y Body Measures, disponibles en su formato .XPT bruto y accesibles a través de las variables DEMO_file, MCQ_file y BMX_file. Une los 3 conjuntos de datos usando la variable SEQN. Una buena forma de hacerlo es con Reduce(), que te permite combinar elementos de manera útil.

El código de unión, que se te proporciona, hace lo siguiente:

  • Crea una lista con los 3 conjuntos de datos (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Usa una función personalizada dentro de Reduce() para hacer un inner join de los 3 conjuntos de datos con la variable "SEQN".
  • Guarda el resultado como el conjunto de datos nhanes_combined.

Este ejercicio forma parte del curso

Diseño experimental en R

Ver curso

Instrucciones del ejercicio

  • Carga el paquete haven.
  • Importa los tres archivos de datos con llamadas separadas a read_xpt(), donde las entradas de estas 3 llamadas a read_xpt() son DEMO_file, MCQ_file y BMX_file, y guarda los resultados como nhanes_demo, nhanes_medical y nhanes_bodymeasures, respectivamente.
  • Crea nhanes_combined uniendo los 3 conjuntos de datos que acabas de importar, usando el código proporcionado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load haven
___

# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___

# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
  Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)
Editar y ejecutar código