Remoção de duplicatas parciais
Agora que você identificou e removeu as duplicatas completas, é hora de verificar se há duplicatas parciais. As duplicatas parciais são um pouco mais complicadas de lidar do que as duplicatas completas. Neste exercício, você primeiro identificará as duplicatas parciais e, em seguida, praticará a técnica mais comum para lidar com elas, que envolve eliminar todas as duplicatas parciais, mantendo apenas a primeira.
dplyr
é carregado e bike_share_rides
está disponível.
Este exercício faz parte do curso
Limpeza de dados no R
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___