Supprimer les doublons partiels
Maintenant que vous avez identifié et supprimé les doublons complets, il est temps de vérifier les doublons partiels. Les doublons partiels sont un peu plus délicats à traiter que les doublons complets. Dans cet exercice, vous allez d’abord identifier d’éventuels doublons partiels, puis vous entraîner à utiliser la technique la plus courante pour les gérer : supprimer tous les doublons partiels en ne conservant que le premier.
dplyr est chargé et bike_share_rides est disponible.
Cet exercice fait partie du cours
Nettoyer des données avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Find duplicated ride_ids
bike_share_rides %>%
# Count the number of occurrences of each ride_id
___ %>%
# Filter for rows with a count > 1
___