Usando stat_sum
No conjunto de dados Vocab, education e vocabulary são variáveis inteiras. No curso introdutório, você viu que isso é uma das quatro causas de overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.
Uma solução, mostrada na etapa 1, é aplicar jitter com transparência. Outra solução é usar stat_sum(), que calcula o número total de observações sobrepostas e mapeia isso para a estética size.
stat_sum() permite uma variável especial, ..prop.., para mostrar a proporção de valores dentro do conjunto de dados.
Este exercicio faz parte do curso
Visualização de Dados Intermediária com ggplot2
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)