1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonでの時系列データ操作

Connected

Exercise

2000年以降のNYCオゾンデータに対する360日ローリングの中央値と標準偏差

前の動画では、.groupby() と同様に .agg() メソッドを使って複数のローリング統計量を計算する方法も紹介しました。

これまでに見たオゾンのデータを使って、NYC の大気質の推移をもう少し詳しく見ていきます。日次データは変動が大きいため、より長期のローリング平均を使うと長期トレンドが見えやすくなります。

ここでは360日のローリングウィンドウを使い、2000年以降のオゾン日平均値に対して、.agg() でローリングの平均と標準偏差を計算します。

Instructions

100 XP

pandas は pd、matplotlib.pyplot は plt としてすでにインポート済みです。

  • pd.read_csv() を使って 'ozone.csv' を読み込み、parse_dates と index_col を使って 'date' 列から DateTimeIndex を作成し、結果を data に代入してから .dropna() で欠損値を落とします。
  • 'Ozone' 列を選択し、360期間の .rolling() ウィンドウを作成して .agg() を適用し、mean と std を計算して rolling_stats に代入します。
  • .join() を使って data と rolling_stats を連結し、stats に代入します。
  • subplots を使って stats をプロットします。