CommencerCommencer gratuitement

Suppression des valeurs en double

Les lignes dupliquées dans un jeu de données peuvent fausser les résultats d’analyse. Vous souhaitez identifier et supprimer ces doublons.

Le DataFrame spotify_df est à votre disposition.

Cet exercice fait partie du cours

Introduction à Polars

Afficher le cours

Instructions

  • Créez un nouveau DataFrame, unique_df, en supprimant les lignes dupliquées (définies par le même titre et le même artiste).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Keep only unique songs (based on title and artist)
unique_df = spotify_df.____

print(unique_df)
Modifier et exécuter le code