1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w Pythonie

Connected

ćwiczenie

Obliczanie VIF

Jak pokazano w filmie, jedną z najczęściej stosowanych diagnostyk wielokoliniowości jest współczynnik inflacji wariancji (VIF, ang. variance inflation factor), obliczany dla każdej zmiennej objaśniającej.

Pamiętaj, że stosowana reguła kciuka zakłada próg VIF na poziomie 2,5 – jeśli VIF przekracza tę wartość, należy wziąć pod uwagę wpływ wielokoliniowości na dopasowany model.

Wcześniej dopasowany model oraz zbiór danych crab są wstępnie załadowane w przestrzeni roboczej.

Instrukcje

100 XP
  • Z biblioteki statsmodels zaimportuj variance_inflation_factor.
  • Ze zbioru danych crab wybierz kolumny weight, width i color i zapisz jako X. Dodaj do X kolumnę Intercept wypełnioną jedynkami.
  • Używając funkcji DataFrame() z biblioteki pandas, utwórz pustą ramkę danych vif i dodaj nazwy kolumn z X w kolumnie Variables.
  • Dla każdej zmiennej oblicz VIF za pomocą funkcji variance_inflation_factor() i zapisz wynik w ramce danych vif w kolumnie VIF.