stat_sum gebruiken
In de Vocab-gegevensset zijn education en vocabulary geheelgetalvariabelen. In de eerste cursus zag je dat dit een van de vier oorzaken van overplotting is. Je krijgt dan één punt op elk snijpunt van de twee variabelen.
Een oplossing, getoond in stap 1, is jitteren met transparantie. Een andere oplossing is stat_sum() gebruiken, die het totale aantal overlappende observaties berekent en dat koppelt aan de size-esthetiek.
stat_sum() biedt een speciale variabele, ..prop.., om het aandeel waarden binnen de gegevensset te tonen.
Deze oefening maakt deel uit van de cursus
Gevorderde datavisualisatie met ggplot2
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
# Replace this with a sum stat
geom_jitter(alpha = 0.25)