EDA con NHANES
Vamos a examinar el conjunto de datos que acabamos de construir con la intención de hacer EDA. Como en el capítulo anterior, es buena idea mirar tanto medidas numéricas de resumen como visualizaciones. Esto ayuda a entender los datos y a detectar pasos de limpieza que quizá hayas pasado por alto. El conjunto nhanes_combined ya está precargado para ti.
Imagina que tenemos acceso a pacientes de NHANES y queremos estudiar el efecto sobre el peso de que un médico les indique reducir calorías/grasa en su dieta. Este es nuestro tratamiento; supongamos que, en lugar de ser una pregunta hecha al paciente, asignamos aleatoriamente a algunos pacientes a recibir asesoramiento nutricional por parte de médicos. Sin embargo, sospechamos que puede haber diferencias de peso según el género del paciente: ¡un factor de bloqueo!
Este ejercicio forma parte del curso
Diseño experimental en R
Instrucciones del ejercicio
- Completa y ejecuta el código de
dplyrpara encontrar el peso medio (bmxwt) en kg según nuestro tratamiento (mcq365d). ¿Hay algo interesante sobre los pacientes con tratamientoNA? - Completa el código de
ggplot2para ver un diagrama de caja del IQR de los pesos de los pacientes según la variable de tratamiento.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fill in the dplyr code
___ %>%
group_by(___) %>%
summarize(mean = mean(___, na.rm = TRUE))
# Fill in the ggplot2 code
___ %>%
ggplot(aes(as.factor(___), ___)) +
geom_boxplot() +
labs(x = "Treatment",
y = "Weight")