IniziaInizia gratis

Overplotting 1: insiemi di dati grandi

Gli scatter plot (con geom_point()) sono intuitivi, facili da capire e molto comuni, ma dobbiamo considerare sempre l’overplotting, in particolare nelle quattro situazioni seguenti:

  1. Insiemi di dati grandi
  2. Valori allineati su un singolo asse
  3. Dati a bassa precisione
  4. Dati interi

In genere si consiglia l’uso del blending con alpha (cioè aggiungere trasparenza) quando si usano forme piene. In alternativa, puoi usare forme opache ma vuote.

Punti molto piccoli sono adatti per insiemi di dati grandi con regioni ad alta densità (molte sovrapposizioni).

Usiamo il dataset diamonds per esercitarci a gestire il caso di un insieme di dati grande.

Questo esercizio fa parte del corso

Introduzione alla visualizzazione dei dati con ggplot2

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))

# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___
Modifica ed esegui il codice