NHANES EDA
Esploriamo il nostro nuovo insieme di dati con un approccio di EDA. Come nel capitolo precedente, è una buona idea guardare sia le misure riassuntive numeriche sia le visualizzazioni. Aiutano a capire i dati e sono un ottimo modo per individuare passaggi di data cleaning che potresti aver saltato. L'insieme di dati nhanes_combined è stato precaricato per te.
Poniamo di avere accesso ai pazienti NHANES e di voler condurre uno studio sull'effetto, sul peso, dell'essere stati invitati da un medico a ridurre calorie/grassi nella dieta. Questo è il nostro trattamento; immaginiamo che, invece di essere una domanda rivolta al paziente, alcuni pazienti siano stati assegnati casualmente a ricevere consigli nutrizionali da un medico. Tuttavia, sospettiamo che possa esserci una differenza di peso in base al genere del paziente: un fattore di blocco!
Questo esercizio fa parte del corso
Progettazione Sperimentale in R
Istruzioni dell'esercizio
- Completa ed esegui il codice
dplyrper trovare il peso medio (bmxwt) in kg in base al nostro trattamento (mcq365d). C'è qualcosa di interessante riguardo ai pazienti con trattamentoNA? - Completa il codice
ggplot2per visualizzare un boxplot dell'IQR dei pesi dei pazienti per variabile di trattamento.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fill in the dplyr code
___ %>%
group_by(___) %>%
summarize(mean = mean(___, na.rm = TRUE))
# Fill in the ggplot2 code
___ %>%
ggplot(aes(as.factor(___), ___)) +
geom_boxplot() +
labs(x = "Treatment",
y = "Weight")