LoslegenKostenlos loslegen

Ausreißer erkennen

Betrachte die Verteilung der Lebenserwartungen der Länder in Asien, die hier zu sehen ist. Das Boxplot markiert einen klaren Ausreißer: ein Land mit auffallend niedriger Lebenserwartung. Hast du eine Vermutung, welches Land das sein könnte? Teste deine Vermutung in der Konsole mit min() oder filter() und erstelle anschließend einen Plot, in dem dieses Land entfernt wurde.

Diese Übung ist Teil des Kurses

Explorative Datenanalyse in R

Kurs anzeigen

Anleitung zur Übung

gap2007 ist weiterhin in deinem Workspace verfügbar.

  • Wende einen Filter an, sodass nur Beobachtungen aus Asien enthalten sind, und erstelle dann eine neue Variable namens is_outlier, die für Länder mit einer Lebenserwartung unter 50 den Wert TRUE hat. Weise das Ergebnis gap_asia zu.
  • Filtere gap_asia, um alle Ausreißer zu entfernen, und erstelle dann ein weiteres Boxplot für die verbleibenden Lebenserwartungen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Filter for Asia, add column indicating outliers
gap_asia <- ___ %>%
  filter(___) %>%
  mutate(___ = ___)

# Remove outliers, create box plot of lifeExp
gap_asia %>%
  filter(___) %>%
  ggplot(aes(x = ___, y = ___)) +
  ___
Code bearbeiten und ausführen