ComenzarEmpieza gratis

Sobretrazado 1: grandes conjuntos de datos

Los gráficos de dispersión (utilizando geom_point()) son intuitivos, fáciles de entender y muy habituales, pero siempre debemos tener en cuenta la posibilidad de sobretrazar, sobre todo en las cuatro situaciones siguientes:

  1. Grandes conjuntos de datos
  2. Valores alineados en un solo eje
  3. Datos de baja precisión
  4. Datos enteros

Normalmente, se recomienda la mezcla alfa (es decir, añadir transparencia) cuando se utilizan formas sólidas. Como alternativa, puedes utilizar formas opacas y huecas.

Los puntos pequeños son adecuados para grandes conjuntos de datos con regiones de alta densidad (mucho solapamiento).

Utilicemos el conjunto de datos diamonds para practicar el caso del conjunto de datos grande.

Este ejercicio forma parte del curso

Introducción a la visualización de datos con ggplot2

Ver curso

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))

# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___
Editar y ejecutar código