CommencerCommencer gratuitement

Supprimer les doublons partiels

Maintenant que vous avez identifié et supprimé les doublons complets, il est temps de vérifier les doublons partiels. Les doublons partiels sont un peu plus délicats à traiter que les doublons complets. Dans cet exercice, vous allez d’abord identifier d’éventuels doublons partiels, puis vous entraîner à utiliser la technique la plus courante pour les gérer : supprimer tous les doublons partiels en ne conservant que le premier.

dplyr est chargé et bike_share_rides est disponible.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Find duplicated ride_ids
bike_share_rides %>% 
  # Count the number of occurrences of each ride_id
  ___ %>% 
  # Filter for rows with a count > 1
  ___
Modifier et exécuter le code