Courbes de densité pondérées par l’enquête
On peut aussi examiner la forme d’une variable à l’aide de la courbe lissée d’un graphique de densité. Créons une courbe de densité des heures de sommeil par nuit, avec un découpage par genre. Alors que la hauteur des barres d’un histogramme représente des effectifs, la hauteur de la courbe de densité représente des probabilités. Il faudra donc effectuer un peu de préparation des données avant de tracer le graphique.
Cet exercice fait partie du cours
Analyzing Survey Data in R
Instructions
- Pour
NHANESraw, supprimez les lignes oùSleepHrsNightouGenderest manquant. - En regroupant par
Gender, ajoutez la colonneWTMEC4YR_stdqui vautWTMEC4YR/sum(WTMEC4YR). - Redirigez vos données préparées directement dans un
ggplot()oùSleepHrsNightest mappé àxetWTMEC4YR_stdest utilisé comme poids. Ajoutez une couche de densité avecbw = 0.6etfill = "gold", ainsi qu’une couche de facettage où vous facetiez parGender.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Density plot of sleep faceted by gender
NHANESraw %>%
___(!is.na(___), !is.na(___)) %>%
group_by(___) %>%
mutate(WTMEC4YR_std = ___) %>%
ggplot(mapping = aes(x = ___, weight = ___)) +
geom____(bw = 0.6, fill = "gold") +
labs(x = "Hours of Sleep") +
____wrap(~___, labeller = "label_both")