BaşlayınÜcretsiz başlayın

Temel bileşenlerle doğrusal regresyon

newsData nesnesi şimdi ek bir değişken içeriyor: logShares. Paylaşım sayısı, haber makalelerinin kaç kez paylaşıldığını gösterir. Ancak bu dağılım oldukça çarpık olurdu, bu yüzden paylaşım sayısının logaritmasıyla çalışacaksın. Az önce öğrendiklerini uygula ve log paylaşımları tahmin et!

Bu egzersiz, kursun bir parçasıdır

R ile Pazarlama Analitiği için Machine Learning

Kursa Göz Atın

Egzersiz talimatları

  • Log paylaşımları diğer tüm değişkenlerle tahmin eden bir model hesapla. Bunu mod1 olarak sakla.
  • Log paylaşımlar ve ilk 6 bileşendeki değerlerle yeni bir veri çerçevesi dataNewsComponents oluştur. pcaNews nesnesi yine PCA sonuçlarını içerir.
  • Sadece 6 bileşenle log paylaşımları tahmin eden ikinci bir model (mod2) hesapla.
  • Modellerin düzeltilmiş R kare değerlerini karşılaştır. Yalnızca temel bileşenleri kullanınca değer nasıl değişti? Modelin ne kadar iyi?

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Predict log shares with all original variables
mod1 <- lm(logShares ~ ., data = ___)

# Create dataframe with log shares and first 6 components
dataNewsComponents <- cbind(logShares = newsData[, "logShares"],
                            ___$x[, 1:__]) %>%
  as.data.frame()

# Predict log shares with first six components
mod2 <- lm(___ ~ ., data = ___)

# Print adjusted R squared for both models
___(mod1)$adj.r.squared
summary(___)$___
Kodu Düzenle ve Çalıştır