Sobreposição 1: grandes conjuntos de dados
Os gráficos de dispersão (usando geom_point()
) são intuitivos, fáceis de entender e muito comuns, mas sempre devemos considerar a possibilidade de fazer um gráfico excessivo, principalmente nas quatro situações a seguir:
- Grandes conjuntos de dados
- Valores alinhados em um único eixo
- Dados de baixa precisão
- Dados inteiros
Normalmente, recomenda-se a combinação alfa (ou seja, adicionar transparência) ao usar formas sólidas. Como alternativa, você pode usar formas opacas e ocas.
Pontos pequenos são adequados para conjuntos de dados grandes com regiões de alta densidade (muita sobreposição).
Vamos usar o conjunto de dados diamonds
para praticar como lidar com o caso do conjunto de dados grande.
Este exercício faz parte do curso
Introdução à visualização de dados com ggplot2
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___