Aan de slagGa gratis aan de slag

Boxplots voor uitschieters

Naast het aangeven van het centrum en de spreiding van een verdeling, biedt een boxplot ook een grafische manier om uitschieters op te sporen. Je kunt deze methode toepassen op de kolom msrp (fabrikantadviesprijs) om te zien of er ongewoon dure of goedkope auto's zijn.

Deze oefening maakt deel uit van de cursus

Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

  • Maak een boxplot van msrp.
  • Sluit de grootste 3–5 uitschieters uit door te filteren op auto's met een prijs onder $100,000. Sla deze verkleinde gegevensset op als cars_no_out.
  • Maak een vergelijkbare boxplot van msrp met deze verkleinde gegevensset. Vergelijk de twee grafieken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Code bewerken en uitvoeren