ComeçarComece gratuitamente

Sobreposição 1: grandes conjuntos de dados

Os gráficos de dispersão (usando geom_point()) são intuitivos, fáceis de entender e muito comuns, mas sempre devemos considerar a possibilidade de fazer um gráfico excessivo, principalmente nas quatro situações a seguir:

  1. Grandes conjuntos de dados
  2. Valores alinhados em um único eixo
  3. Dados de baixa precisão
  4. Dados inteiros

Normalmente, recomenda-se a combinação alfa (ou seja, adicionar transparência) ao usar formas sólidas. Como alternativa, você pode usar formas opacas e ocas.

Pontos pequenos são adequados para conjuntos de dados grandes com regiões de alta densidade (muita sobreposição).

Vamos usar o conjunto de dados diamonds para praticar como lidar com o caso do conjunto de dados grande.

Este exercício faz parte do curso

Introdução à visualização de dados com ggplot2

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))

# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___
Editar e executar código