CommencerCommencez gratuitement

Suppression des valeurs en double

Les lignes dupliquées dans un jeu de données peuvent fausser les résultats d’analyse. Vous souhaitez identifier et supprimer ces doublons.

Le DataFrame spotify_df est à votre disposition.

Cet exercice fait partie du cours

<cours>Introduction à Polars</cours>
Voir le cours

Instructions de l’exercice

  • Créez un nouveau DataFrame, unique_df, en supprimant les lignes dupliquées (définies par le même titre et le même artiste).

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Keep only unique songs (based on title and artist)
unique_df = spotify_df.____

print(unique_df)
Modifier et exécuter le code