ComeçarComece de graça

Usando stat_sum

No conjunto de dados Vocab, education e vocabulary são variáveis inteiras. No primeiro curso, você viu que essa é uma das quatro causas do overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.

Uma solução, mostrada na etapa 1, é o jittering com transparência. Outra solução é usar o site stat_sum(), que calcula o número total de observações sobrepostas e o mapeia para a estética size.

stat_sum() permite que uma variável especial, ..prop.., mostre a proporção de valores no conjunto de dados.

Este exercício faz parte do curso

Visualização intermediária de dados com ggplot2

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Editar e executar o código