ComeçarComece gratuitamente

Remoção de duplicatas parciais

Agora que você identificou e removeu as duplicatas completas, é hora de verificar se há duplicatas parciais. As duplicatas parciais são um pouco mais complicadas de lidar do que as duplicatas completas. Neste exercício, você primeiro identificará as duplicatas parciais e, em seguida, praticará a técnica mais comum para lidar com elas, que envolve eliminar todas as duplicatas parciais, mantendo apenas a primeira.

dplyr é carregado e bike_share_rides está disponível.

Este exercício faz parte do curso

Limpeza de dados no R

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Find duplicated ride_ids
bike_share_rides %>% 
  # Count the number of occurrences of each ride_id
  ___ %>% 
  # Filter for rows with a count > 1
  ___
Editar e executar código