1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Usuwanie częściowych duplikatów

Po zidentyfikowaniu i usunięciu pełnych duplikatów czas sprawdzić, czy w danych nie ma częściowych duplikatów. Są one nieco trudniejsze w obsłudze niż pełne duplikaty. W tym ćwiczeniu najpierw je zidentyfikujesz, a następnie przećwiczysz najpopularniejszą metodę radzenia sobie z nimi – usunięcie wszystkich częściowych duplikatów z zachowaniem tylko pierwszego wystąpienia.

dplyr jest załadowany, a bike_share_rides jest dostępny.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Zlicz liczbę wystąpień każdego ride_id.
  • Przefiltruj wyniki, aby wyświetlić tylko te ride_id, które występują więcej niż raz.