Suppression des valeurs en double
Les lignes dupliquées dans un jeu de données peuvent fausser les résultats d’analyse. Vous souhaitez identifier et supprimer ces doublons.
Le DataFrame spotify_df est à votre disposition.
Cet exercice fait partie du cours
<cours>Introduction à Polars</cours>Instructions de l’exercice
- Créez un nouveau DataFrame,
unique_df, en supprimant les lignes dupliquées (définies par le même titre et le même artiste).
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Keep only unique songs (based on title and artist)
unique_df = spotify_df.____
print(unique_df)