ComeçarComece de graça

Calcular o VIF

Como você viu no vídeo, um dos diagnósticos mais usados para multicolinearidade é o fator de inflação da variância (VIF), calculado para cada variável explicativa.

Lembre-se do vídeo que a regra prática é um limiar de VIF igual a 2,5. Isso significa que, se o VIF estiver acima de 2,5, você deve considerar que há efeito de multicolinearidade no seu modelo ajustado.

O model previamente ajustado e o conjunto de dados crab já estão carregados no ambiente de trabalho.

Este exercício faz parte do curso

Modelos Lineares Generalizados em Python

Ver curso

Instruções do exercício

  • Importe variance_inflation_factor de statsmodels.
  • Do conjunto de dados crab, escolha weight, width e color e salve como X. Adicione a coluna Intercept de uns a X.
  • Usando a função DataFrame() do pandas, crie um dataframe vif vazio e adicione os nomes das colunas de X na coluna Variables.
  • Para cada variável, calcule o VIF usando a função variance_inflation_factor() e salve no dataframe vif com o nome de coluna VIF.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import functions
from statsmodels.stats.outliers_influence import ____

# Get variables for which to compute VIF and add intercept term
X = ____[[____, ____, ____]]
X[____] = 1

# Compute and view VIF
vif = pd.____
vif["variables"] = X.____
vif["VIF"] = [____(X.values, i) for i in range(X.shape[1])]

# View results using print
____(____)
Editar e executar o código