Échauffement à la manipulation de données
Échauffons un peu vos compétences de manipulation de données avec tidyverse et examinons le nombre de cas déclarés par année pour la région des Amériques ('AMR').
Pour cela, nous allons d’abord filtrer le jeu de données sur la région qui nous intéresse, puis créer un simple nuage de points des années en fonction des cas.
De plus, réglez l’opacité des points à 50 % (0.5) afin d’évaluer le chevauchement des données.
Cet exercice fait partie du cours
Bonnes pratiques de visualisation avec R
Instructions
- Filtrez
who_diseasepour ne conserver que les données de la région'AMR'. - Modifiez les esthétiques pour mapper
yearsur l’axe des x etcasessur l’axe des y. - Réduisez l’opacité (
alpha) des points à0.5pour visualiser le chevauchement dansgeom_point()
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# filter data to AMR region.
amr_region <- who_disease %>%
___(___)
# map x to year and y to cases.
ggplot(amr_region, aes(___)) +
# lower alpha to 0.5 to see overlap.
geom_point(___)