Rimozione dei duplicati parziali
Ora che hai identificato e rimosso i duplicati completi, è il momento di controllare i duplicati parziali. I duplicati parziali sono un po' più complicati da gestire rispetto a quelli completi. In questo esercizio, prima individuerai eventuali duplicati parziali e poi proverai la tecnica più comune per gestirli, che consiste nell'eliminare tutti i duplicati parziali, mantenendo solo il primo.
dplyr è caricato e bike_share_rides è disponibile.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___