LoslegenKostenlos loslegen

NHANES: EDA

Schauen wir uns unseren neu erstellten Datensatz im Sinne einer EDA an. Wie im letzten Kapitel ist es sinnvoll, sowohl numerische Zusammenfassungen als auch Visualisierungen zu betrachten. Beides hilft beim Verständnis der Daten und zeigt dir oft, welche Datenbereinigungsschritte du vielleicht übersehen hast. Der Datensatz nhanes_combined wurde für dich vorab geladen.

Angenommen, wir haben Zugang zu NHANES-Patient:innen und wollen eine Studie zum Effekt der ärztlichen Empfehlung, die Kalorien-/Fettzufuhr zu reduzieren, auf das Gewicht durchführen. Das ist unsere Behandlung; wir tun so, als hätten wir zufällig einigen Patient:innen Ernährungsberatung durch Ärzt:innen zugewiesen, statt sie nur dazu zu befragen. Wir vermuten jedoch, dass das Gewicht je nach Geschlecht der Patient:innen unterschiedlich sein könnte – ein Blockfaktor!

Diese Übung ist Teil des Kurses

Versuchsplanung in R

Kurs anzeigen

Anleitung zur Übung

  • Ergänze und führe den dplyr-Code aus, um das mittlere Gewicht (bmxwt) in kg nach unserer Behandlung (mcq365d) zu bestimmen. Fällt dir bei den Patient:innen mit NA in der Behandlung etwas auf?
  • Ergänze den ggplot2-Code, um ein Boxplot des IQR der Patientengewichte nach der Behandlungsvariable zu erstellen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fill in the dplyr code
___ %>% 
  group_by(___) %>% 
  summarize(mean = mean(___, na.rm = TRUE))

# Fill in the ggplot2 code
___ %>% 
  ggplot(aes(as.factor(___), ___)) +
  geom_boxplot() +
  labs(x = "Treatment",
       y = "Weight")
Code bearbeiten und ausführen