Construção do conjunto de dados NHANES
Conforme baixados do site do NHANES, os conjuntos de dados NHANES estão disponíveis apenas como arquivos .XPT, um formato nativo do SAS. Felizmente, temos o pacote haven.
Vamos combinar os conjuntos de dados de Demografia, Condições Médicas e Medidas Corporais do NHANES, disponíveis em formato .XPT bruto e acessíveis pelas variáveis DEMO_file, MCQ_file e BMX_file. Una os 3 conjuntos usando a variável SEQN. Uma boa forma de fazer isso é usando Reduce(), que permite combinar elementos de um jeito prático.
O código de junção, que já está fornecido, faz o seguinte:
- Cria uma lista com os 3 conjuntos de dados (
nhanes_demo,nhanes_medical,nhanes_bodymeasures). - Usa uma função personalizada dentro de
Reduce()para fazer um inner join dos 3 conjuntos usando a variável"SEQN". - Salva o resultado como o conjunto de dados
nhanes_combined.
Este exercício faz parte do curso
Planejamento de Experimentos em R
Instruções do exercício
- Carregue o pacote
haven. - Importe os três arquivos de dados com chamadas separadas a
read_xpt(), onde as entradas dessas 3 chamadas aread_xpt()sãoDEMO_file,MCQ_fileeBMX_file, e salve-os comonhanes_demo,nhanes_medicalenhanes_bodymeasures, respectivamente. - Crie
nhanes_combinedmesclando os 3 conjuntos de dados que você acabou de importar, usando o código fornecido.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load haven
___
# Import the three datasets using read_xpt()
nhanes_demo <- read_xpt(DEMO_file)
___
___
# Merge the 3 datasets you just created to create nhanes_combined
nhanes_combined <- list(nhanes_demo, nhanes_medical, nhanes_bodymeasures) %>%
Reduce(function(df1, df2) inner_join(df1, df2, by = "SEQN"), .)