Uso di stat_sum
Nel dataset Vocab, education e vocabulary sono variabili intere. Nel primo corso, hai visto che questa è una delle quattro cause di overplotting: otterresti un unico punto in ogni intersezione tra le due variabili.
Una soluzione, mostrata nel passo 1, è usare jitter e trasparenza. Un'altra soluzione è usare stat_sum(), che calcola il numero totale di osservazioni sovrapposte e lo mappa sulla caratteristica estetica size.
stat_sum() consente una variabile speciale, ..prop.., per mostrare la proporzione di valori all'interno dell'insieme di dati.
Questo esercizio fa parte del corso
Visualizzazione dei dati intermedia con ggplot2
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)