Interpolazione: tempi intermedi
In questo esercizio costruirai un modello lineare adattandolo a una serie temporale mensile del Dow Jones Industrial Average (DJIA) e poi userai quel modello per fare previsioni sui dati giornalieri (di fatto, un'interpolazione). Quindi confronterai quella previsione giornaliera con i dati giornalieri reali del DJIA.
Qualche nota sui dati. "OHLC" sta per "Open-High-Low-Close" (apertura–massimo–minimo–chiusura), che di solito sono dati giornalieri, ad esempio i prezzi di apertura e chiusura, e i prezzi massimo e minimo di un'azione in un dato giorno. "DayCount" è un numero intero di giorni a partire dall'inizio della raccolta dei dati.

Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Usa
ols()per.fit()un modello condata=df_monthlyeformula="Close ~ DayCount". - Usa
model_fit.predict()sia sudf_monthly.DayCountsia sudf_daily.DayCountper prevedere i valori dei prezziClosemensili e giornalieri, da salvare come nuova colonnaModelin ciascun DataFrame. - Usa due volte la funzione predefinita
plot_model_with_data, sudf_monthlye sudf_daily, e confronta i valori di RSS mostrati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# build and fit a model to the df_monthly data
model_fit = ols('Close ~ DayCount', ____=df_monthly).____()
# Use the model FIT to the MONTHLY data to make a predictions for both monthly and daily data
df_monthly['Model'] = model_fit.____(df_monthly.____)
df_daily['Model'] = model_fit.____(df_daily.____)
# Plot the monthly and daily data and model, compare the RSS values seen on the figures
fig_monthly = plot_model_with_data(____)
fig_daily = plot_model_with_data(____)