LoslegenKostenlos loslegen

Entfernen von teilweisen Duplikaten

Nachdem du nun die vollständigen Duplikate identifiziert und entfernt hast, ist es an der Zeit, nach teilweisen Duplikaten zu suchen. Teilweise Duplikate sind ein bisschen schwieriger zu handhaben als vollständige Duplikate. In dieser Übung identifizierst du zunächst alle partiellen Duplikate und übst dann die gängigste Technik, um damit umzugehen: Du lässt alle partiellen Duplikate fallen und behältst nur das erste.

dplyr geladen ist und bike_share_rides verfügbar ist.

Diese Übung ist Teil des Kurses

Daten in R bereinigen

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Find duplicated ride_ids
bike_share_rides %>% 
  # Count the number of occurrences of each ride_id
  ___ %>% 
  # Filter for rows with a count > 1
  ___
Code bearbeiten und ausführen