1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Metoda najmniejszych kwadratów z `statsmodels`

Wiele bibliotek Pythona udostępnia wygodne, abstrakcyjne interfejsy, dzięki którym nie musisz za każdym razem ręcznie zarządzać całą maszynerią optymalizacji modelu.

W tym ćwiczeniu użyjesz biblioteki statsmodels w bardziej ogólnym, wysokopoziomowym przepływie pracy – do budowy modelu metodą najmniejszych kwadratów (minimalizacja RSS).

Aby ułatwić ci start, dane zostały wcześniej wczytane za pomocą x_data, y_data = load_data() i zapisane w ramce danych pandas z kolumnami x_column i y_column przy użyciu df = pd.DataFrame(dict(x_column=x_data, y_column=y_data))

Instrukcje

100 XP
  • Zbuduj model ols() z formułą formula="y_column ~ x_column" i danymi data=df, a następnie dopasuj go do danych metodą .fit().
  • Użyj model_fit.predict(), aby uzyskać wartości y_model.
  • Za pomocą dostarczonej funkcji plot_data_with_model() nanieś y_model na wykres z y_data.
  • Wyodrębnij wartości parametrów modelu a0 i a1 z model_fit.params.
  • Użyj compute_rss_and_plot_fit(), aby sprawdzić, czy wyniki są zgodne z analitycznymi wzorami zaimplementowanymi w numpy.