Usando stat_sum
No conjunto de dados Vocab, education e vocabulary são variáveis inteiras. No curso introdutório, você viu que isso é uma das quatro causas de overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.
Uma solução, mostrada na etapa 1, é aplicar jitter com transparência. Outra solução é usar stat_sum(), que calcula o número total de observações sobrepostas e mapeia isso para a estética size.
stat_sum() permite uma variável especial, ..prop.., para mostrar a proporção de valores dentro do conjunto de dados.
Este exercício faz parte do curso
Visualização de Dados Intermediária com ggplot2
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)