1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ一般化線形モデル

Connected

演習

VIF を計算する

動画で学んだように、多重共線性の診断で最も広く使われている指標のひとつが分散拡大要因(VIF)で、これは各説明変数ごとに計算します。

また、経験則としてのしきい値は VIF が 2.5 程度で、VIF が 2.5 を超える場合は、当てはめたモデルに多重共線性の影響があると考えるべきだと動画で説明しました。

以前に当てはめた model と crab データセットはワークスペースに読み込まれています。

指示

100 XP
  • statsmodels から variance_inflation_factor をインポートします。
  • crab データセットから weight、width、color を選んで X として保存し、X に 1 の Intercept 列を追加します。
  • pandas の DataFrame() を使って空の vif データフレームを作成し、X の列名を Variables 列に追加します。
  • 各変数について variance_inflation_factor() 関数で VIF を計算し、vif データフレームの VIF 列に保存します。