1. 学ぶ
  2. /
  3. コース
  4. /
  5. Polars入門

Connected

演習

列に対する複数の集計

異なる年やアーティスト間でストリーミングの傾向がどう変わるかを理解するため、Spotify のストリーミングデータを分析します。まずは基本的な group-by から始め、そこに複数の統計量を加えていきます。

spotify_df DataFrame が用意されています。

指示1 / 2

undefined XP
  • 1
    • spotify_df を "year" 列と "artist" 列の両方でグループ化し、各組み合わせについて .mean() による平均ストリーム数を計算します。
  • 2
    • 年とアーティストごとに、平均値と最大値のストリーム数を計算します。列名には "_mean" と "_max" のサフィックスを付けてください。