Aan de slagGa gratis aan de slag

stat_sum gebruiken

In de Vocab-gegevensset zijn education en vocabulary geheelgetalvariabelen. In de eerste cursus zag je dat dit een van de vier oorzaken van overplotting is. Je krijgt dan één punt op elk snijpunt van de twee variabelen.

Een oplossing, getoond in stap 1, is jitteren met transparantie. Een andere oplossing is stat_sum() gebruiken, die het totale aantal overlappende observaties berekent en dat koppelt aan de size-esthetiek.

stat_sum() biedt een speciale variabele, ..prop.., om het aandeel waarden binnen de gegevensset te tonen.

Deze oefening maakt deel uit van de cursus

Gevorderde datavisualisatie met ggplot2

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Code bewerken en uitvoeren