1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza szeregów czasowych w Pythonie

Connected

ćwiczenie

Analiza współczynnika R-kwadrat regresji

R-kwadrat mierzy, jak dobrze dane dopasowują się do linii regresji. W prostej regresji R-kwadrat jest powiązany z korelacją między dwiema zmiennymi – mianowicie wartość bezwzględna korelacji to pierwiastek kwadratowy z R-kwadrat, a znak korelacji odpowiada znakowi współczynnika regresji.

W tym ćwiczeniu zaczniesz korzystać z pakietu statystycznego statsmodels, który oferuje wiele narzędzi do modelowania i testowania statystycznego dostępnych wcześniej głównie w R oraz w pakietach takich jak SAS i MATLAB.

Wezwiesz dwie serie danych, x i y, obliczysz ich korelację, a następnie przeprowadzisz regresję y względem x za pomocą funkcji OLS(y,x) z biblioteki statsmodels.api (zwróć uwagę, że zmienna zależna y jest pierwszym argumentem). Większość regresji liniowych zawiera wyraz wolny, czyli wyraz stały (\(\small \alpha\) w równaniu regresji \(\small y_t=\alpha + \beta x_t + \epsilon_t\)). Aby uwzględnić wyraz stały w funkcji OLS(), musisz dodać kolumnę jedynek po prawej stronie równania regresji.

Moduł statsmodels.api został już zaimportowany jako sm.

Instrukcje

100 XP
  • Oblicz korelację między x i y, używając metody .corr().
  • Przeprowadź regresję:
    • Najpierw przekształć serię x na DataFrame dfx.
    • Dodaj wyraz stały za pomocą sm.add_constant() i przypisz wynik do dfx1.
    • Dokonaj regresji y względem dfx1, używając sm.OLS().fit().
  • Wyświetl wyniki regresji i porównaj wartość R-kwadrat ze współczynnikiem korelacji.