Aan de slagGa gratis aan de slag

Boxplots en dichtheidsplots

Het verbruik van een auto hangt vaak samen met de grootte van de motor (gemeten als het aantal cilinders). Om de relatie tussen deze twee variabelen te verkennen, kun je histrogrammen gebruiken, maar in deze oefening ga je aan de slag met twee alternatieven: de boxplot en de dichtheidsplot.

Deze oefening maakt deel uit van de cursus

Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

Een snelle blik op unique(cars$ncyl) laat zien dat er meer mogelijke niveaus van ncyl zijn dan je misschien denkt. Richt je hier op de meest voorkomende niveaus.

  • Filter cars zodat alleen auto's met 4, 6 of 8 cilinders overblijven en sla het resultaat op als common_cyl. De operator %in% kan hier handig zijn.
  • Maak naast elkaar geplaatste boxplots van city_mpg, uitgesplitst naar ncyl.
  • Maak overlappende dichtheidsplots van city_mpg, ingekleurd naar ncyl.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Filter cars with 4, 6, 8 cylinders
common_cyl <- filter(___, ___)

# Create box plots of city mpg by ncyl
ggplot(___, aes(x = as.factor(___), y = ___)) +
  geom_boxplot()

# Create overlaid density plots for same data
ggplot(common_cyl, aes(x = ___, fill = as.factor(___))) +
  geom_density(alpha = .3)
Code bewerken en uitvoeren