Teilweise Duplikate entfernen
Nachdem du die vollständigen Duplikate identifiziert und entfernt hast, ist es Zeit, nach teilweisen Duplikaten zu suchen. Teilweise Duplikate sind etwas schwieriger zu behandeln als vollständige. In dieser Übung identifizierst du zunächst alle teilweisen Duplikate und übst dann die gängigste Technik, um damit umzugehen: alle teilweisen Duplikate zu verwerfen und nur den ersten Eintrag zu behalten.
dplyr ist geladen und bike_share_rides ist verfügbar.
Diese Übung ist Teil des Kurses
Datenbereinigung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___