CommencerCommencer gratuitement

Utiliser stat_sum

Dans le jeu de données Vocab, education et vocabulary sont des variables entières. Dans le premier cours, vous avez vu que c’est l’une des quatre causes de surimpression des points : vous obtenez un seul point à chaque intersection entre les deux variables.

Une solution, présentée à l’étape 1, consiste à ajouter du jitter avec transparence. Une autre consiste à utiliser stat_sum(), qui calcule le nombre total d’observations qui se chevauchent et le mappe sur l’esthétique size.

stat_sum() permet d’utiliser une variable spéciale, ..prop.., pour afficher la proportion des valeurs dans le jeu de données.

Cet exercice fait partie du cours

Visualisation de données intermédiaire avec ggplot2

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Modifier et exécuter le code