Interpolasi: Waktu di Antara
Dalam latihan ini, Anda akan membangun model linear dengan menyesuaikan data deret waktu bulanan untuk Dow Jones Industrial Average (DJIA), lalu menggunakan model tersebut untuk membuat prediksi pada data harian (secara efektif, sebuah interpolasi). Setelah itu, Anda akan membandingkan prediksi harian tersebut dengan data DJIA harian yang sesungguhnya.
Beberapa catatan tentang data. "OHLC" adalah singkatan dari "Open-High-Low-Close", yang biasanya berupa data harian, misalnya harga pembukaan dan penutupan, serta harga tertinggi dan terendah, untuk suatu saham pada hari tertentu. "DayCount" adalah jumlah hari dalam bilangan bulat sejak awal pengumpulan data.

Latihan ini adalah bagian dari kursus
Pengantar Pemodelan Linear di Python
Petunjuk latihan
- Gunakan
ols()untuk.fit()model padadata=df_monthlydenganformula="Close ~ DayCount". - Gunakan
model_fit.predict()padadf_monthly.DayCountdandf_daily.DayCountuntuk memprediksi nilai hargaClosebulanan dan harian, lalu simpan sebagai kolom baruModeldi masing-masing DataFrame. - Gunakan fungsi
plot_model_with_datayang telah disediakan sebanyak dua kali, masing-masing padadf_monthlydandf_daily, lalu bandingkan nilai RSS yang ditampilkan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# build and fit a model to the df_monthly data
model_fit = ols('Close ~ DayCount', ____=df_monthly).____()
# Use the model FIT to the MONTHLY data to make a predictions for both monthly and daily data
df_monthly['Model'] = model_fit.____(df_monthly.____)
df_daily['Model'] = model_fit.____(df_daily.____)
# Plot the monthly and daily data and model, compare the RSS values seen on the figures
fig_monthly = plot_model_with_data(____)
fig_daily = plot_model_with_data(____)