Median & deviasi standar rolling 360 hari untuk data ozon NYC sejak 2000
Video terakhir juga menunjukkan cara menghitung beberapa statistik rolling menggunakan metode .agg(), mirip dengan .groupby().
Mari kita cermati riwayat kualitas udara NYC menggunakan data Ozone yang sudah Anda lihat sebelumnya. Data harian sangat bergejolak, sehingga menggunakan rerata rolling jangka lebih panjang dapat membantu menyingkap tren jangka panjang.
Anda akan menggunakan jendela rolling 360 hari, dan .agg() untuk menghitung rerata dan deviasi standar rolling untuk nilai rata-rata harian ozon sejak 2000.
Latihan ini adalah bagian dari kursus
Memanipulasi Data Deret Waktu di Python
Petunjuk latihan
Kami telah mengimpor pandas sebagai pd, dan matplotlib.pyplot sebagai plt.
- Gunakan
pd.read_csv()untuk mengimpor'ozone.csv', membuatDateTimeIndexdari kolom'date'menggunakanparse_datesdanindex_col, simpan hasilnya kedata, dan hapus nilai hilang menggunakan.dropna(). - Pilih kolom
'Ozone'dan buat jendela.rolling()menggunakan 360 periode, terapkan.agg()untuk menghitungmeandanstd, lalu simpan sebagairolling_stats. - Gunakan
.join()untuk menggabungkandatadenganrolling_stats, lalu simpan sebagaistats. - Plot
statsmenggunakansubplots.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats