LoslegenKostenlos loslegen

Teilweise Duplikate entfernen

Nachdem du die vollständigen Duplikate identifiziert und entfernt hast, ist es Zeit, nach teilweisen Duplikaten zu suchen. Teilweise Duplikate sind etwas schwieriger zu behandeln als vollständige. In dieser Übung identifizierst du zunächst alle teilweisen Duplikate und übst dann die gängigste Technik, um damit umzugehen: alle teilweisen Duplikate zu verwerfen und nur den ersten Eintrag zu behalten.

dplyr ist geladen und bike_share_rides ist verfügbar.

Diese Übung ist Teil des Kurses

Datenbereinigung in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Find duplicated ride_ids
bike_share_rides %>% 
  # Count the number of occurrences of each ride_id
  ___ %>% 
  # Filter for rows with a count > 1
  ___
Code bearbeiten und ausführen