IniziaInizia gratis

Uso di stat_sum

Nel dataset Vocab, education e vocabulary sono variabili intere. Nel primo corso, hai visto che questa è una delle quattro cause di overplotting: otterresti un unico punto in ogni intersezione tra le due variabili.

Una soluzione, mostrata nel passo 1, è usare jitter e trasparenza. Un'altra soluzione è usare stat_sum(), che calcola il numero totale di osservazioni sovrapposte e lo mappa sulla caratteristica estetica size.

stat_sum() consente una variabile speciale, ..prop.., per mostrare la proporzione di valori all'interno dell'insieme di dati.

Questo esercizio fa parte del corso

Visualizzazione dei dati intermedia con ggplot2

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Modifica ed esegui il codice