1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶ時系列解析

Connected

연습 문제

回帰の R 二乗を確認する

R 二乗は、データが回帰直線にどれだけよく当てはまっているかを表します。したがって、単回帰の R 二乗は 2 つの変数間の相関と関係があります。特に、相関の大きさは R 二乗の平方根に等しく、相関の符号は回帰係数の符号と一致します。

この演習では、統計パッケージの statsmodels を使い始めます。これは、R や SAS、MATLAB のようなソフトウェアにある多くの統計モデリングや検定を実行できます。

2 つの系列 x と y の相関を計算し、続いて statsmodels.api ライブラリの関数 OLS(y,x) を使って y を x に対して回帰します(従属変数、すなわち右辺の変数である y が最初の引数である点に注意してください)。多くの線形回帰には切片(回帰 \(\small y_t=\alpha + \beta x_t + \epsilon_t\) における \(\small \alpha\))である定数項が含まれます。OLS() で定数項を含めるには、回帰の右辺に 1 の列を追加する必要があります。

statsmodels.api モジュールは sm としてインポート済みです。

지침

100 XP
  • .corr() メソッドを使って x と y の相関を計算します。
  • 回帰を実行します:
    • まず Series の x を DataFrame の dfx に変換します。
    • sm.add_constant() を使って定数項を追加し、dfx1 に代入します。
    • sm.OLS().fit() で y を dfx1 に対して回帰します。
  • 回帰結果を出力し、R 二乗と相関を比較します。