LoslegenKostenlos loslegen

Boxplots zur Ausreißererkennung

Zusätzlich zur Darstellung von Zentrum und Streuung einer Verteilung bietet ein Boxplot eine grafische Möglichkeit, Ausreißer zu erkennen. Wende diese Methode auf die Spalte msrp (unverbindliche Preisempfehlung des Herstellers) an, um festzustellen, ob es ungewöhnlich teure oder günstige Autos gibt.

Diese Übung ist Teil des Kurses

Explorative Datenanalyse in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Boxplot von msrp.
  • Schließe die größten 3–5 Ausreißer aus, indem du die Zeilen filterst und nur Autos mit weniger als $100,000 behältst. Speichere diesen reduzierten Datensatz als cars_no_out.
  • Erstelle ein ähnliches Boxplot von msrp mit diesem reduzierten Datensatz. Vergleiche die beiden Plots.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Construct box plot of msrp
cars %>%
  ggplot(aes(x = 1, y = ___)) +
  geom_boxplot()

# Exclude outliers from data
cars_no_out <- cars %>%
  filter(___)

# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
  ___ +
  ___
Code bearbeiten und ausführen