NHANES EDA
Vamos examinar nosso conjunto de dados recém-construído com foco em EDA. Como no capítulo anterior, é uma boa ideia observar tanto medidas numéricas de resumo quanto visualizações. Isso ajuda a entender os dados e é uma ótima forma de identificar etapas de limpeza que você pode ter deixado passar. O conjunto de dados nhanes_combined já foi carregado para você.
Suponha que temos acesso a pacientes do NHANES e queremos conduzir um estudo sobre o efeito de receber orientação de um médico para reduzir calorias/gordura na dieta sobre o peso. Esse é o nosso tratamento; vamos supor que, em vez de ser uma pergunta feita ao paciente, aleatoriamente alguns médicos aconselharam certos pacientes sobre nutrição. No entanto, suspeitamos que possa haver diferença no peso com base no gênero do paciente — um fator de bloqueio!
Este exercício faz parte do curso
Planejamento de Experimentos em R
Instruções do exercício
- Complete e execute o código
dplyrpara encontrar o peso médio (bmxwt) em kg por nosso tratamento (mcq365d). Há algo interessante sobre os pacientes comNAno tratamento? - Complete o código
ggplot2para ver um boxplot do IQR dos pesos dos pacientes pela variável de tratamento.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fill in the dplyr code
___ %>%
group_by(___) %>%
summarize(mean = mean(___, na.rm = TRUE))
# Fill in the ggplot2 code
___ %>%
ggplot(aes(as.factor(___), ___)) +
geom_boxplot() +
labs(x = "Treatment",
y = "Weight")