Numerieke samenvattingen van leeftijd
We gaan verder met onze verkennende data-analyse van de numerieke verklarende variabele age door samenvattende statistieken te berekenen. Samenvattende statistieken nemen veel waarden en vatten die samen in één getal. Laten we drie van zulke waarden berekenen met dplyr-databewerking: het gemiddelde (ook wel de average), de mediaan (de middelste waarde) en de standaarddeviatie (een maat voor spreiding/variatie).
Deze oefening maakt deel uit van de cursus
Modelleren met data in de Tidyverse
Oefeninstructies
Bereken het gemiddelde, de mediaan en de standaarddeviatie van age.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load packages
library(moderndive)
library(dplyr)
# Compute summary stats
evals %>%
___(mean_age = ___(age),
median_age = ___(age),
sd_age = ___(age))