MulaiMulai sekarang secara gratis

Menghindari multikolinearitas

Kembali ke himpunan data penjualan kita salesData yang sudah dimuat di workspace. Selain itu, paket rms juga telah dimuat.

Mari kita estimasi regresi linear berganda! Tentu saja, kita ingin memanfaatkan semua variabel yang ada di himpunan data.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Analitik Pemasaran dengan R

Lihat Kursus

Petunjuk latihan

  • Silakan hitung model penuh bernama salesModel1 menggunakan semua variabel kecuali id untuk menjelaskan penjualan pada bulan ini. Untuk melakukannya, isikan nama variabel yang benar ke dalam sintaks dummy berikut: response ~ . - excluded_variable. Ini dapat dibaca sebagai "response dimodelkan oleh semua variabel kecuali excluded_variable."
  • Estimasikan variance inflation factor menggunakan fungsi vif() dari paket rms.
  • Selain mengecualikan variabel id, hapus juga variabel preferredBrand dan nBrands untuk menghindari multikolinearitas. Anda dapat melakukannya dengan menambahkan masing-masing variabel tersebut dengan -. Simpan modelnya dalam objek bernama salesModel2.
  • Estimasikan kembali variance inflation factor dari model tersebut. Apakah sekarang Anda akan menerima hasilnya?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Estimating the full model
salesModel1 <- lm(salesThisMon ~ . - ___, 
                 data = salesData)

# Checking variance inflation factors
vif(___)

# Estimating new model by removing information on brand
salesModel2 <- lm(salesThisMon ~ . - ___, 
                 data = ___)

# Checking variance inflation factors
___
Edit dan Jalankan Kode