Menghindari multikolinearitas
Kembali ke himpunan data penjualan kita salesData yang sudah dimuat di workspace. Selain itu, paket rms juga telah dimuat.
Mari kita estimasi regresi linear berganda! Tentu saja, kita ingin memanfaatkan semua variabel yang ada di himpunan data.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Petunjuk latihan
- Silakan hitung model penuh bernama
salesModel1menggunakan semua variabel kecualiiduntuk menjelaskan penjualan pada bulan ini. Untuk melakukannya, isikan nama variabel yang benar ke dalam sintaks dummy berikut:response ~ . - excluded_variable. Ini dapat dibaca sebagai "responsedimodelkan oleh semua variabel kecualiexcluded_variable." - Estimasikan variance inflation factor menggunakan fungsi
vif()dari paketrms. - Selain mengecualikan variabel
id, hapus juga variabelpreferredBranddannBrandsuntuk menghindari multikolinearitas. Anda dapat melakukannya dengan menambahkan masing-masing variabel tersebut dengan-. Simpan modelnya dalam objek bernamasalesModel2. - Estimasikan kembali variance inflation factor dari model tersebut. Apakah sekarang Anda akan menerima hasilnya?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Estimating the full model
salesModel1 <- lm(salesThisMon ~ . - ___,
data = salesData)
# Checking variance inflation factors
vif(___)
# Estimating new model by removing information on brand
salesModel2 <- lm(salesThisMon ~ . - ___,
data = ___)
# Checking variance inflation factors
___