Suppression des valeurs en double
Les lignes dupliquées dans un jeu de données peuvent fausser les résultats d’analyse. Vous souhaitez identifier et supprimer ces doublons.
Le DataFrame spotify_df est à votre disposition.
Cet exercice fait partie du cours
Introduction à Polars
Instructions
- Créez un nouveau DataFrame,
unique_df, en supprimant les lignes dupliquées (définies par le même titre et le même artiste).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Keep only unique songs (based on title and artist)
unique_df = spotify_df.____
print(unique_df)