Dubbele waarden verwijderen
Dubbele rijen in een gegevensset kunnen je analyse vertekenen. Je wilt duplicaten opsporen en verwijderen.
De DataFrame spotify_df is voor je beschikbaar.
Deze oefening maakt deel uit van de cursus
Introductie tot Polars
Oefeninstructies
- Maak een nieuwe DataFrame,
unique_df, waarin dubbele rijen (gedefinieerd als dezelfde title en artist) zijn verwijderd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Keep only unique songs (based on title and artist)
unique_df = spotify_df.____
print(unique_df)