Supprimer les valeurs en double
Maintenant que vous connaissez les étapes pour nettoyer le jeu de données, passons à l’action et supprimons les lignes en double.
Vous allez utiliser Python pour réaliser ces transformations. Pas besoin d’être un expert : servez-vous de CleanerBot3000 pour comprendre pourquoi il est important de supprimer les doublons dans un jeu de données, puis identifiez la fonction à utiliser dans Pandas (une bibliothèque Python).
Assurez-vous que CleanerBot3000 a appliqué cette fonction et vous a fourni une vue mise à jour de votre jeu de données !
Quelle est la fonction Pandas correcte pour supprimer les doublons ?
Cet exercice fait partie du cours
Nettoyer des données avec l’IA générative
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice