Staafdiagrammen: geaggregeerde gegevens gebruiken
Als het wél passend is om staafdiagrammen te gebruiken (zie de video!), dan is het fijn om een indruk te geven van het aantal waarden in elke groep.
stat_summary() houdt het aantal niet bij. stat_sum() doet dat (daar is het voor bedoeld), maar dat is lastig toegankelijk. Het is makkelijker om zelf precies te berekenen wat we willen plotten.
Hier hebben we een samenvattende data frame gemaakt, mtcars_by_cyl, met per cilinderklasse cyl het gemiddelde (mean_wt), de standaarddeviatie (sd_wt) en het aantal (n_wt) van de autogewichten. Het bevat ook het aandeel (prop) van elke cilinderklasse in de volledige gegevensset. Gebruik de console om vertrouwd te raken met de data frame mtcars_by_cyl.
Deze oefening maakt deel uit van de cursus
Gevorderde datavisualisatie met ggplot2
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Using mtcars_cyl, plot mean_wt vs. cyl
___ +
# Add a bar layer with identity stat, filled skyblue
___