LoslegenKostenlos starten

Kein Mitglied

Nachdem du geübt hast, Probleme mit Mitgliedschaftsbedingungen zu erkennen, ist es Zeit, diese Probleme in einem neuen Datensatz zu beheben. In diesem Kapitel arbeitest du mit einem Datensatz namens sfo_survey, der Umfrageantworten von Passagieren enthält, die vom San Francisco International Airport (SFO) abfliegen. Die Teilnehmer wurden zu Sauberkeit, Wartezeiten, Sicherheit und ihrer allgemeinen Zufriedenheit befragt.

Bei der Datenerhebung gab es ein paar Probleme, die zu Unstimmigkeiten im Datensatz geführt haben. In dieser Übung arbeitest du mit der Spalte dest_size, die die Größe des Zielflughafens kategorisiert, zu dem die Passagiere geflogen sind. Ein Data Frame namens dest_sizes steht zur Verfügung, der alle möglichen Zielgrößen enthält. Deine Aufgabe ist es, Zeilen mit ungültigen dest_size-Werten zu finden und sie aus dem Data Frame zu entfernen.

dplyr wurde geladen und sfo_survey sowie dest_sizes sind verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Datenbereinigung in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Count the number of occurrences of dest_size
sfo_survey %>%
  count(___)
Code bearbeiten und ausführen