Axe des x catégoriel
Dans les graphiques précédents, nous avons vu que les cas d’oreillons n’ont commencé à être déclarés qu’en 1999, ce qui rend les comparaisons d’avant cette date non pertinentes.
Filtrons les données pour ne conserver que les cas signalés à partir de 1999, puis créons un diagramme à barres empilées montrant la proportion des différentes maladies par région.
Modifiez la chaîne de manipulation des données pour obtenir le format souhaité, puis construisez votre graphique à barres empilées et affichez-le ! Ne vous souciez pas d’ordonner les barres comme dans l’exercice précédent. Voyez-vous des motifs surprenants ?
Cet exercice fait partie du cours
Bonnes pratiques de visualisation avec R
Instructions
- Filtrez les données
who_diseasepour ne conserver que les années 1999 et suivantes. - Ajoutez à
group_by()afin de conserver l’informationregiondans le résumé. - Renseignez les esthétiques avec
x = region,y = total_casesetfill = disease.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
disease_counts <- who_disease %>%
# Filter to on or later than 1999
filter(___) %>%
mutate(disease = ifelse(disease %in% c('measles', 'mumps'), disease, 'other')) %>%
group_by(disease, ___) %>% # Add region column to grouping
summarise(total_cases = sum(cases))
# Set aesthetics so disease is the stacking variable, region is the x-axis and counts are the y
ggplot(disease_counts, aes(___)) +
# Add a column geometry with the proper position value.
___(___)