Comece agoraComece grátis

Usando stat_sum

No conjunto de dados Vocab, education e vocabulary são variáveis inteiras. No curso introdutório, você viu que isso é uma das quatro causas de overplotting. Você obteria um único ponto em cada interseção entre as duas variáveis.

Uma solução, mostrada na etapa 1, é aplicar jitter com transparência. Outra solução é usar stat_sum(), que calcula o número total de observações sobrepostas e mapeia isso para a estética size.

stat_sum() permite uma variável especial, ..prop.., para mostrar a proporção de valores dentro do conjunto de dados.

Este exercicio faz parte do curso

Visualização de Dados Intermediária com ggplot2

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Editar e Executar Código