1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Metoda nejmenších čtverců s `statsmodels`

Mnoho pythonových knihoven nabízí pohodlná abstrahovaná rozhraní, takže nemusíš vždy explicitně pracovat s celou optimalizační mašinérií modelu.

V tomto cvičení jako příklad použiješ knihovnu statsmodels ve víceúrovňovém, zobecněném pracovním postupu pro sestavení modelu pomocí optimalizace metodou nejmenších čtverců (minimalizace RSS).

Aby ses mohl/a rovnou pustit do práce, data z x_data, y_data = load_data() jsme pro tebe předem načetli a uložili do pandas DataFrame s názvy sloupců x_column a y_column pomocí df = pd.DataFrame(dict(x_column=x_data, y_column=y_data))

Pokyny

100 XP
  • Sestav model ols() s formulí formula="y_column ~ x_column" a daty data=df, a poté ho přizpůsob datům pomocí .fit().
  • Pomocí model_fit.predict() získej hodnoty y_model.
  • S využitím připravené funkce plot_data_with_model() vykresli y_data spolu s y_model.
  • Extrahuj hodnoty parametrů modelu a0 a a1 z model_fit.params.
  • Pomocí compute_rss_and_plot_fit() ověř, že tyto výsledky jsou konzistentní s analytickými vzorci implementovanými v numpy.