1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ時系列データの可視化

Connected

Exercise

集計値を表示する

データをより集約した形で表示したい場面があります。たとえば、co2_levels には週次データが入っていますが、年内の各月で集計して表示したいことがあります。インデックスが datetime 型の co2_levels のようなデータセットでは、インデックス中の各日付の年を次のように抽出できます。

# df DataFrame の各日付から年を取り出す
index_year = df.index.year

df DataFrame のインデックスにある日付から月や日を取り出すには、それぞれ df.index.month と df.index.day を使います。 次に、co2_levels DataFrame の各インデックスから抽出した年と groupby 関数を使って、年ごとの CO2 濃度の平均を計算できます。

df_by_year = df.groupby(index_year).mean()

Instructions

100 XP
  • co2_levels DataFrame のインデックスにある各日付について、月を抽出して index_month という変数に代入します。
  • pandas ライブラリの groupby と mean 関数を使って、co2_levels の月ごとの CO2 濃度の平均を計算し、mean_co2_levels_by_month という新しい DataFrame に代入します。
  • mean_co2_levels_by_month DataFrame の値をプロットし、目盛りのフォントサイズを 6 に設定します。