Hitung VIF
Seperti yang Anda pelajari di video, salah satu diagnostik yang paling umum digunakan untuk multikolinearitas adalah variance inflation factor atau VIF, yang dihitung untuk setiap variabel penjelas.
Ingat dari video bahwa aturan praktis ambang batasnya adalah VIF sebesar 2,5, artinya jika VIF di atas 2,5 Anda perlu mempertimbangkan adanya pengaruh multikolinearitas pada model yang dipasangkan.
model yang sebelumnya dipasangkan dan himpunan data crab sudah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Petunjuk latihan
- Dari
statsmodelsimporvariance_inflation_factor. - Dari himpunan data
crab, pilihweight,width, dancolorlalu simpan sebagaiX. Tambahkan kolomInterceptberisi nilai satu keX. - Dengan fungsi
pandasDataFrame()buat dataframevifkosong dan tambahkan nama-nama kolomXke kolomVariables. - Untuk setiap variabel, hitung VIF menggunakan fungsi
variance_inflation_factor()dan simpan ke dalam dataframevifdengan nama kolomVIF.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import functions
from statsmodels.stats.outliers_influence import ____
# Get variables for which to compute VIF and add intercept term
X = ____[[____, ____, ____]]
X[____] = 1
# Compute and view VIF
vif = pd.____
vif["variables"] = X.____
vif["VIF"] = [____(X.values, i) for i in range(X.shape[1])]
# View results using print
____(____)