Aan de slagBegin gratis

stat_sum gebruiken

In de Vocab-gegevensset zijn education en vocabulary geheelgetalvariabelen. In de eerste cursus zag je dat dit een van de vier oorzaken van overplotting is. Je krijgt dan één punt op elk snijpunt van de twee variabelen.

Een oplossing, getoond in stap 1, is jitteren met transparantie. Een andere oplossing is stat_sum() gebruiken, die het totale aantal overlappende observaties berekent en dat koppelt aan de size-esthetiek.

stat_sum() biedt een speciale variabele, ..prop.., om het aandeel waarden binnen de gegevensset te tonen.

Deze oefening maakt deel uit van de cursus

Gevorderde datavisualisatie met ggplot2

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Run this, look at the plot, then update it
ggplot(Vocab, aes(x = education, y = vocabulary)) +
  # Replace this with a sum stat
  geom_jitter(alpha = 0.25)
Code bewerken en uitvoeren