Ausreißer erkennen
Betrachte die Verteilung der Lebenserwartungen der Länder in Asien, die hier zu sehen ist. Das Boxplot markiert einen klaren Ausreißer: ein Land mit auffallend niedriger Lebenserwartung. Hast du eine Vermutung, welches Land das sein könnte? Teste deine Vermutung in der Konsole mit min() oder filter() und erstelle anschließend einen Plot, in dem dieses Land entfernt wurde.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in R
Anleitung zur Übung
gap2007 ist weiterhin in deinem Workspace verfügbar.
- Wende einen Filter an, sodass nur Beobachtungen aus Asien enthalten sind, und erstelle dann eine neue Variable namens
is_outlier, die für Länder mit einer Lebenserwartung unter 50 den WertTRUEhat. Weise das Ergebnisgap_asiazu. - Filtere
gap_asia, um alle Ausreißer zu entfernen, und erstelle dann ein weiteres Boxplot für die verbleibenden Lebenserwartungen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
filter(___) %>%
mutate(___ = ___)
# Remove outliers, create box plot of lifeExp
gap_asia %>%
filter(___) %>%
ggplot(aes(x = ___, y = ___)) +
___