Dépivotage des données : du format large au format long
Vous avez effectué un groupby-aggregation sur les données Spotify qui vous donne un ensemble de statistiques sur le nombre d’écoutes par artiste et par année dans le DataFrame wide_df. Vous souhaitez maintenant convertir les données de wide_df au format long pour les utiliser dans une visualisation.
Cet exercice fait partie du cours
Introduction à Polars
Instructions
- Utilisez
"artist"et"year"comme colonnes d’index pour identifier les données de chaque ligne. - Dépivotez les colonnes de statistiques de
wide_df:"avg_streams","max_streams","min_streams". - Nommez la colonne des variables
"metric"et la colonne des valeurs"stream_count".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
long_df = (
wide_df
.unpivot(
# Set the index columns
index=____,
# Unpivot on the stats columns
on=____,
# Name the variable and value columns
variable_name=____,
value_name=____
)
)
print("\nLong format DataFrame:")
print(long_df)