Spreidingsmaten berekenen
Laten we de krachtige group_by()- en summarize()-syntaxis uitbreiden naar spreidingsmaten. Als je niet zeker weet of je met symmetrische of scheve verdelingen werkt, is het een goed idee om naast de gebruikelijke variantie of standaarddeviatie ook een robuuste maat zoals de IQR mee te nemen.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in R
Oefeninstructies
De gap2007-gegevensset die je in een eerdere oefening hebt gemaakt, is beschikbaar in je werkruimte.
- Vat voor elk continent in
gap2007de levensverwachting samen metsd(),IQR()en het aantal landen,n(). Je hoeft de nieuwe kolommen hier geen namen te geven. De functien()binnen jesummarize()-aanroep neemt geen argumenten. - Vergelijk de spreiding van deze verdelingen grafisch door overlappende dichtheidsplots van de levensverwachting te maken, uitgesplitst naar continent.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)