Çoklu doğrusal bağlantıdan kaçınmak
Çalışma alanına zaten yüklenmiş olan satış veri kümesine, yani salesData'ya geri dönelim. Ayrıca rms paketi de yüklü.
Hadi çoklu doğrusal regresyon kuralım! Elbette, veri kümesindeki tüm değişkenlerden yararlanmak istiyoruz.
Bu egzersiz
R ile Pazarlama Analitiği için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bu ayki satışları açıklamak için
iddışındaki tüm değişkenleri kullanaraksalesModel1adlı tam bir model hesapla. Bunu yapmak için, aşağıdaki şablon sözdizimine doğru değişken adlarını yerleştir:response ~ . - excluded_variable. Bu, "response,excluded_variablehariç tüm değişkenlerle modellenir" olarak okunabilir. rmspaketindekivif()fonksiyonunu kullanarak varyans şişirme faktörlerini hesapla.iddeğişkenini dışlamaya ek olarak, çoklu doğrusal bağlantıyı önlemek içinpreferredBrandvenBrandsdeğişkenlerini de kaldır. Bunu, her birini-ile ekleyerek yapacaksın. ModelisalesModel2adlı bir nesnede sakla.- Modelin varyans şişirme faktörlerini yeniden hesapla. Şimdi sonuçları kabul eder miydin?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Estimating the full model
salesModel1 <- lm(salesThisMon ~ . - ___,
data = salesData)
# Checking variance inflation factors
vif(___)
# Estimating new model by removing information on brand
salesModel2 <- lm(salesThisMon ~ . - ___,
data = ___)
# Checking variance inflation factors
___