ComeçarComece de graça

Usando stat_sum

No conjunto de dados Vocab, education e vocabulary são variáveis inteiras. No curso introdutório, você viu que isso é uma das quatro causas de overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.

Uma solução, mostrada na etapa 1, é aplicar jitter com transparência. Outra solução é usar stat_sum(), que calcula o número total de observações sobrepostas e mapeia isso para a estética size.

stat_sum() permite uma variável especial, ..prop.., para mostrar a proporção de valores dentro do conjunto de dados.

Este exercício faz parte do curso

Visualização de Dados Intermediária com ggplot2

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Editar e executar o código