Diagrammes en barres : utiliser des données agrégées
Lorsqu’il est pertinent d’utiliser des diagrammes en barres (voir la vidéo !), il est utile de donner une idée du nombre de valeurs dans chaque groupe.
stat_summary() ne conserve pas le compte. stat_sum() oui (c’est son objectif), mais il est difficile d’y accéder. Il est plus simple de calculer nous‑mêmes exactement ce que nous voulons tracer.
Ici, nous avons créé une table de synthèse appelée mtcars_by_cyl qui contient, pour chaque groupe de cylindres cyl, la moyenne (mean_wt), l’écart‑type (sd_wt) et l’effectif (n_wt) des poids des voitures. Elle contient également la proportion (prop) de chaque catégorie de cylindres dans l’ensemble du jeu de données. Utilisez la console pour vous familiariser avec la table mtcars_by_cyl.
Cet exercice fait partie du cours
Visualisation de données intermédiaire avec ggplot2
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Using mtcars_cyl, plot mean_wt vs. cyl
___ +
# Add a bar layer with identity stat, filled skyblue
___