Boxplots zur Ausreißererkennung
Zusätzlich zur Darstellung von Zentrum und Streuung einer Verteilung bietet ein Boxplot eine grafische Möglichkeit, Ausreißer zu erkennen. Wende diese Methode auf die Spalte msrp (unverbindliche Preisempfehlung des Herstellers) an, um festzustellen, ob es ungewöhnlich teure oder günstige Autos gibt.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in R
Anleitung zur Übung
- Erstelle ein Boxplot von
msrp. - Schließe die größten 3–5 Ausreißer aus, indem du die Zeilen filterst und nur Autos mit weniger als $100,000 behältst. Speichere diesen reduzierten Datensatz als
cars_no_out. - Erstelle ein ähnliches Boxplot von
msrpmit diesem reduzierten Datensatz. Vergleiche die beiden Plots.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Construct box plot of msrp
cars %>%
ggplot(aes(x = 1, y = ___)) +
geom_boxplot()
# Exclude outliers from data
cars_no_out <- cars %>%
filter(___)
# Construct box plot of msrp using the reduced dataset
cars_no_out %>%
___ +
___