Mendeteksi multikolinearitas
Dalam latihan ini, Anda akan memeriksa multikolinearitas di antara semua variabel dengan menggunakan Variance Inflation Factor (VIF). Anda dapat menghitung VIF menggunakan fungsi vif() dari paket car.
Nilai VIF tersedia pada kolom GVIF di keluaran dan biasanya dicetak dalam format eksponensial. Jika Anda belum familiar dengan format ini, Anda dapat menggunakan fungsi format():
sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)
"22130000000"
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Pergantian Karyawan dengan R
Petunjuk latihan
- Muat paket
car. - Periksa multikolinearitas pada model (
multi_log) yang Anda bangun di latihan sebelumnya. - Variabel mana yang memiliki VIF tertinggi? Tetapkan nama variabel tersebut sebagai string ke
highest.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the car package
___
# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)
# Check for multicollinearity
___
# Which variable has the highest VIF?
highest <- ___