Utiliser stat_sum
Dans le jeu de données Vocab, education et vocabulary sont des variables entières. Dans le premier cours, vous avez vu que c’est l’une des quatre causes de surimpression des points : vous obtenez un seul point à chaque intersection entre les deux variables.
Une solution, présentée à l’étape 1, consiste à ajouter du jitter avec transparence. Une autre consiste à utiliser stat_sum(), qui calcule le nombre total d’observations qui se chevauchent et le mappe sur l’esthétique size.
stat_sum() permet d’utiliser une variable spéciale, ..prop.., pour afficher la proportion des valeurs dans le jeu de données.
Cet exercice fait partie du cours
<cours>Visualisation de données intermédiaire avec ggplot2</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)