1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modele Liniare Generalizate în Python

Connected

exercițiu

Calculează VIF

Așa cum ai aflat din videoclip, unul dintre cele mai utilizate instrumente de diagnosticare a multicoliniarității este factorul de inflație a varianței (VIF), calculat pentru fiecare variabilă explicativă.

Reține că pragul orientativ este VIF = 2,5: dacă valoarea VIF depășește 2,5, ar trebui să iei în considerare efectul multicoliniarității asupra modelului ajustat.

model-ul ajustat anterior și setul de date crab sunt preîncărcate în spațiul de lucru.

Instrucțiuni

100 XP
  • Din statsmodels, importă variance_inflation_factor.
  • Din setul de date crab, selectează coloanele weight, width și color și salvează-le ca X. Adaugă o coloană Intercept cu valori de unu în X.
  • Folosind funcția DataFrame() din pandas, creează un dataframe gol numit vif și adaugă numele coloanelor din X în coloana Variables.
  • Pentru fiecare variabilă, calculează VIF folosind funcția variance_inflation_factor() și salvează rezultatele în dataframe-ul vif, în coloana VIF.