Menghapus duplikasi parsial
Sekarang setelah Anda mengidentifikasi dan menghapus duplikasi penuh, saatnya memeriksa duplikasi parsial. Duplikasi parsial sedikit lebih sulit ditangani dibandingkan duplikasi penuh. Pada latihan ini, Anda akan terlebih dahulu mengidentifikasi duplikasi parsial, lalu berlatih teknik yang paling umum untuk menanganinya, yaitu menghapus semua duplikasi parsial dan hanya mempertahankan yang pertama.
dplyr sudah dimuat dan bike_share_rides tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___