IniziaInizia gratis

Rimozione dei duplicati parziali

Ora che hai identificato e rimosso i duplicati completi, è il momento di controllare i duplicati parziali. I duplicati parziali sono un po' più complicati da gestire rispetto a quelli completi. In questo esercizio, prima individuerai eventuali duplicati parziali e poi proverai la tecnica più comune per gestirli, che consiste nell'eliminare tutti i duplicati parziali, mantenendo solo il primo.

dplyr è caricato e bike_share_rides è disponibile.

Questo esercizio fa parte del corso

Pulizia dei dati in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Find duplicated ride_ids
bike_share_rides %>% 
  # Count the number of occurrences of each ride_id
  ___ %>% 
  # Filter for rows with a count > 1
  ___
Modifica ed esegui il codice