Usando stat_sum
No conjunto de dados Vocab
, education
e vocabulary
são variáveis inteiras. No primeiro curso, você viu que essa é uma das quatro causas do overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.
Uma solução, mostrada na etapa 1, é o jittering com transparência. Outra solução é usar o site stat_sum()
, que calcula o número total de observações sobrepostas e o mapeia para a estética size
.
stat_sum()
permite que uma variável especial, ..prop..
, mostre a proporção de valores no conjunto de dados.
Este exercício faz parte do curso
Visualização intermediária de dados com ggplot2
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)