MulaiMulai sekarang secara gratis

Mendeteksi multikolinearitas

Dalam latihan ini, Anda akan memeriksa multikolinearitas di antara semua variabel dengan menggunakan Variance Inflation Factor (VIF). Anda dapat menghitung VIF menggunakan fungsi vif() dari paket car.

Nilai VIF tersedia pada kolom GVIF di keluaran dan biasanya dicetak dalam format eksponensial. Jika Anda belum familiar dengan format ini, Anda dapat menggunakan fungsi format():

sample_vif_value <- 2.213e+10
format(sample_vif_value, scientific = FALSE)

"22130000000"

Latihan ini adalah bagian dari kursus

Analitik SDM: Memprediksi Pergantian Karyawan dengan R

Lihat Kursus

Petunjuk latihan

  • Muat paket car.
  • Periksa multikolinearitas pada model (multi_log) yang Anda bangun di latihan sebelumnya.
  • Variabel mana yang memiliki VIF tertinggi? Tetapkan nama variabel tersebut sebagai string ke highest.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the car package
___

# Model you built in a previous exercise
multi_log <- glm(turnover ~ ., family = "binomial", data = train_set_multi)

# Check for multicollinearity
___

# Which variable has the highest VIF?
highest <- ___
Edit dan Jalankan Kode