Entfernen von teilweisen Duplikaten
Nachdem du nun die vollständigen Duplikate identifiziert und entfernt hast, ist es an der Zeit, nach teilweisen Duplikaten zu suchen. Teilweise Duplikate sind ein bisschen schwieriger zu handhaben als vollständige Duplikate. In dieser Übung identifizierst du zunächst alle partiellen Duplikate und übst dann die gängigste Technik, um damit umzugehen: Du lässt alle partiellen Duplikate fallen und behältst nur das erste.
dplyr
geladen ist und bike_share_rides
verfügbar ist.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___