Boxplots voor uitschieters
Naast het aangeven van het centrum en de spreiding van een verdeling, biedt een boxplot
ook een grafische manier om uitschieters op te sporen. Je kunt deze methode toepassen op de
kolom msrp (fabrikantadviesprijs) om te zien of er ongewoon
dure of goedkope auto's zijn.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in R
Oefeninstructies
- Maak een boxplot van
msrp. - Sluit de grootste 3–5 uitschieters uit door te filteren op auto's met een prijs onder $100,000. Sla deze verkleinde gegevensset op als
cars_no_out. - Maak een vergelijkbare boxplot van
msrpmet deze verkleinde gegevensset. Vergelijk de twee grafieken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___