Ordonner l’empilement pour la lisibilité
Dans le dernier graphique, comme nous avons regroupé toutes les maladies autres que la rougeole et les oreillons dans leur propre catégorie, on peut supposer que la trajectoire de la catégorie « other » nous importe moins que celles de la rougeole et des oreillons.
À cause de cela, le graphique que nous avons créé pose un problème. La façon dont les barres sont empilées — avec measles en haut, mumps au milieu et other en bas — rend difficile l’intuition du comportement des oreillons dans le temps, car sa ligne de base n’est pas constante en raison des variations de la proportion de la rougeole.
Ggplot ordonne les barres et la légende selon l’ordre des variables dans le jeu de données. Pour passer outre, transformez la colonne disease en facteur avec des levels dans l’ordre que nous voulons voir utilisé par le graphique.
Cet exercice fait partie du cours
Bonnes pratiques de visualisation avec R
Instructions
- Modifiez la fonction mutate dans la chaîne de manipulation de données pour convertir
diseaseen facteur aveclevels = c('measles', 'other', 'mumps'). - Refaites le graphique en utilisant le même code que dans le dernier exercice.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
disease_counts <- who_disease %>%
mutate(
disease = ifelse(disease %in% c('measles', 'mumps'), disease, 'other') %>%
factor(___) # change factor levels to desired ordering
) %>%
group_by(disease, year) %>%
summarise(total_cases = sum(cases))
# plot
ggplot(disease_counts, aes(x = year, y = total_cases, fill = disease)) +
geom_col(position = 'fill')