BaşlayınÜcretsiz Başlayın

Temel bileşenlerle doğrusal regresyon

newsData nesnesi şimdi ek bir değişken içeriyor: logShares. Paylaşım sayısı, haber makalelerinin kaç kez paylaşıldığını gösterir. Ancak bu dağılım oldukça çarpık olurdu, bu yüzden paylaşım sayısının logaritmasıyla çalışacaksın. Az önce öğrendiklerini uygula ve log paylaşımları tahmin et!

Bu egzersiz

R ile Pazarlama Analitiği için Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Log paylaşımları diğer tüm değişkenlerle tahmin eden bir model hesapla. Bunu mod1 olarak sakla.
  • Log paylaşımlar ve ilk 6 bileşendeki değerlerle yeni bir veri çerçevesi dataNewsComponents oluştur. pcaNews nesnesi yine PCA sonuçlarını içerir.
  • Sadece 6 bileşenle log paylaşımları tahmin eden ikinci bir model (mod2) hesapla.
  • Modellerin düzeltilmiş R kare değerlerini karşılaştır. Yalnızca temel bileşenleri kullanınca değer nasıl değişti? Modelin ne kadar iyi?

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Predict log shares with all original variables
mod1 <- lm(logShares ~ ., data = ___)

# Create dataframe with log shares and first 6 components
dataNewsComponents <- cbind(logShares = newsData[, "logShares"],
                            ___$x[, 1:__]) %>%
  as.data.frame()

# Predict log shares with first six components
mod2 <- lm(___ ~ ., data = ___)

# Print adjusted R squared for both models
___(mod1)$adj.r.squared
summary(___)$___
Kodu Düzenle ve Çalıştır