IniziaInizia gratis

NHANES EDA

Esploriamo il nostro nuovo insieme di dati con un approccio di EDA. Come nel capitolo precedente, è una buona idea guardare sia le misure riassuntive numeriche sia le visualizzazioni. Aiutano a capire i dati e sono un ottimo modo per individuare passaggi di data cleaning che potresti aver saltato. L'insieme di dati nhanes_combined è stato precaricato per te.

Poniamo di avere accesso ai pazienti NHANES e di voler condurre uno studio sull'effetto, sul peso, dell'essere stati invitati da un medico a ridurre calorie/grassi nella dieta. Questo è il nostro trattamento; immaginiamo che, invece di essere una domanda rivolta al paziente, alcuni pazienti siano stati assegnati casualmente a ricevere consigli nutrizionali da un medico. Tuttavia, sospettiamo che possa esserci una differenza di peso in base al genere del paziente: un fattore di blocco!

Questo esercizio fa parte del corso

Progettazione Sperimentale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Completa ed esegui il codice dplyr per trovare il peso medio (bmxwt) in kg in base al nostro trattamento (mcq365d). C'è qualcosa di interessante riguardo ai pazienti con trattamento NA?
  • Completa il codice ggplot2 per visualizzare un boxplot dell'IQR dei pesi dei pazienti per variabile di trattamento.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fill in the dplyr code
___ %>% 
  group_by(___) %>% 
  summarize(mean = mean(___, na.rm = TRUE))

# Fill in the ggplot2 code
___ %>% 
  ggplot(aes(as.factor(___), ___)) +
  geom_boxplot() +
  labs(x = "Treatment",
       y = "Weight")
Modifica ed esegui il codice