MulaiMulai sekarang secara gratis

Hitung VIF

Seperti yang Anda pelajari di video, salah satu diagnostik yang paling umum digunakan untuk multikolinearitas adalah variance inflation factor atau VIF, yang dihitung untuk setiap variabel penjelas.

Ingat dari video bahwa aturan praktis ambang batasnya adalah VIF sebesar 2,5, artinya jika VIF di atas 2,5 Anda perlu mempertimbangkan adanya pengaruh multikolinearitas pada model yang dipasangkan.

model yang sebelumnya dipasangkan dan himpunan data crab sudah dimuat di workspace.

Latihan ini adalah bagian dari kursus

Generalized Linear Models di Python

Lihat Kursus

Petunjuk latihan

  • Dari statsmodels impor variance_inflation_factor.
  • Dari himpunan data crab, pilih weight, width, dan color lalu simpan sebagai X. Tambahkan kolom Intercept berisi nilai satu ke X.
  • Dengan fungsi pandas DataFrame() buat dataframe vif kosong dan tambahkan nama-nama kolom X ke kolom Variables.
  • Untuk setiap variabel, hitung VIF menggunakan fungsi variance_inflation_factor() dan simpan ke dalam dataframe vif dengan nama kolom VIF.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import functions
from statsmodels.stats.outliers_influence import ____

# Get variables for which to compute VIF and add intercept term
X = ____[[____, ____, ____]]
X[____] = 1

# Compute and view VIF
vif = pd.____
vif["variables"] = X.____
vif["VIF"] = [____(X.values, i) for i in range(X.shape[1])]

# View results using print
____(____)
Edit dan Jalankan Kode