Stichprobengewichtete Dichteplots
Mit der glatten Kurve eines Dichteplots können wir auch die Form einer Variablen untersuchen. Erstelle einen Dichteplot der nächtlichen Schlafdauer und facette nach Geschlecht. Während die Höhe der Histogrammbalken Zählwerte darstellt, repräsentiert die Höhe der Dichtekurve Wahrscheinlichkeiten. Daher müssen wir vor dem Plotten ein wenig Datenaufbereitung durchführen.
Diese Übung ist Teil des Kurses
<Kurs>Umfragen mit R analysieren</Kurs>Übungsanweisungen
- Entferne in
NHANESrawZeilen, in denenSleepHrsNightoderGenderfehlen. - Füge gruppiert nach
Genderdie SpalteWTMEC4YR_stdhinzu, dieWTMEC4YR/sum(WTMEC4YR)entspricht. - Pipe deine aufbereiteten Daten direkt in
ggplot(), wobeiSleepHrsNightaufxundWTMEC4YR_stdauf weight abgebildet wird. Füge eine Dichte-layermitbw = 0.6undfill = "gold"hinzu sowie eine Faceting-Layer, in der du nachGenderfacettierst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Density plot of sleep faceted by gender
NHANESraw %>%
___(!is.na(___), !is.na(___)) %>%
group_by(___) %>%
mutate(WTMEC4YR_std = ___) %>%
ggplot(mapping = aes(x = ___, weight = ___)) +
geom____(bw = 0.6, fill = "gold") +
labs(x = "Hours of Sleep") +
____wrap(~___, labeller = "label_both")