Sobretrazado 1: grandes conjuntos de datos
Los gráficos de dispersión (utilizando geom_point()
) son intuitivos, fáciles de entender y muy habituales, pero siempre debemos tener en cuenta la posibilidad de sobretrazar, sobre todo en las cuatro situaciones siguientes:
- Grandes conjuntos de datos
- Valores alineados en un solo eje
- Datos de baja precisión
- Datos enteros
Normalmente, se recomienda la mezcla alfa (es decir, añadir transparencia) cuando se utilizan formas sólidas. Como alternativa, puedes utilizar formas opacas y huecas.
Los puntos pequeños son adecuados para grandes conjuntos de datos con regiones de alta densidad (mucho solapamiento).
Utilicemos el conjunto de datos diamonds
para practicar el caso del conjunto de datos grande.
Este ejercicio forma parte del curso
Introducción a la visualización de datos con ggplot2
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___