BaşlayınÜcretsiz Başlayın

Çoklu doğrusal bağlantıdan kaçınmak

Çalışma alanına zaten yüklenmiş olan satış veri kümesine, yani salesData'ya geri dönelim. Ayrıca rms paketi de yüklü.

Hadi çoklu doğrusal regresyon kuralım! Elbette, veri kümesindeki tüm değişkenlerden yararlanmak istiyoruz.

Bu egzersiz

R ile Pazarlama Analitiği için Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bu ayki satışları açıklamak için id dışındaki tüm değişkenleri kullanarak salesModel1 adlı tam bir model hesapla. Bunu yapmak için, aşağıdaki şablon sözdizimine doğru değişken adlarını yerleştir: response ~ . - excluded_variable. Bu, "response, excluded_variable hariç tüm değişkenlerle modellenir" olarak okunabilir.
  • rms paketindeki vif() fonksiyonunu kullanarak varyans şişirme faktörlerini hesapla.
  • id değişkenini dışlamaya ek olarak, çoklu doğrusal bağlantıyı önlemek için preferredBrand ve nBrands değişkenlerini de kaldır. Bunu, her birini - ile ekleyerek yapacaksın. Modeli salesModel2 adlı bir nesnede sakla.
  • Modelin varyans şişirme faktörlerini yeniden hesapla. Şimdi sonuçları kabul eder miydin?

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Estimating the full model
salesModel1 <- lm(salesThisMon ~ . - ___, 
                 data = salesData)

# Checking variance inflation factors
vif(___)

# Estimating new model by removing information on brand
salesModel2 <- lm(salesThisMon ~ . - ___, 
                 data = ___)

# Checking variance inflation factors
___
Kodu Düzenle ve Çalıştır