ComeçarComece de graça

Construção do conjunto de dados NHANES

Conforme baixados do site do NHANES, os conjuntos de dados NHANES estão disponíveis apenas como arquivos .XPT, um formato nativo do SAS. Felizmente, temos o pacote haven.

Vamos combinar os conjuntos de dados de Demografia, Condições Médicas e Medidas Corporais do NHANES, disponíveis em formato .XPT bruto e acessíveis pelas variáveis DEMO_file, MCQ_file e BMX_file. Una os 3 conjuntos usando a variável SEQN. Uma boa forma de fazer isso é usando Reduce(), que permite combinar elementos de um jeito prático.

O código de junção, que já está fornecido, faz o seguinte:

  • Cria uma lista com os 3 conjuntos de dados (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Usa uma função personalizada dentro de Reduce() para fazer um inner join dos 3 conjuntos usando a variável "SEQN".
  • Salva o resultado como o conjunto de dados nhanes_combined.

Este exercício faz parte do curso

Planejamento de Experimentos em R

Ver curso

Instruções do exercício

  • Carregue o pacote haven.
  • Importe os três arquivos de dados com chamadas separadas a read_xpt(), onde as entradas dessas 3 chamadas a read_xpt() são DEMO_file, MCQ_file e BMX_file, e salve-os como nhanes_demo, nhanes_medical e nhanes_bodymeasures, respectivamente.
  • Crie nhanes_combined mesclando os 3 conjuntos de dados que você acabou de importar, usando o código fornecido.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load haven
___

# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___

# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
  Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)
Editar e executar o código