BaşlayınÜcretsiz Başlayın

tidymodels ile PCA

Model kurma açısından PCA, daha az özellikle modeller oluşturmanı sağlar ama yine de orijinal verideki bilginin çoğunu yakalar. Ancak gördüğün gibi PCA'nın bir dezavantajı, modeli yorumlamanın zor olmasıdır. Bu egzersizde, ev satışları verisinin bir alt kümesini kullanarak doğrusal regresyon modeli kurmaya odaklanacaksın. Hedef değişken price.

Bileşen çıkarmadan, veriden doğrudan kurulan bir modelin RMSE değeri $236,461.4. tidymodels ile PCA uygulayıp yeni RMSE'yi karşılaştıracaksın. Unutma, daha düşük RMSE daha iyidir.

tidyverse ve tidymodels paketleri senin için yüklendi.

Bu egzersiz

R'de Boyutsal Azaltma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Beş temel bileşen çıkarmak için train üzerinde bir PCA tarifi (recipe) oluştur.
  • Varsayılan linear_reg() model tanımıyla bir workflow uydur.
  • test kullanarak, gerçek ve tahmin değerlerini içeren bir test tahmin veri çerçevesi oluştur.
  • PCA ile azaltılmış doğrusal regresyon modeli için RMSE'yi hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Build a PCA recipe
pca_recipe <- ___(___ ~ ___ , data = ___) %>% 
  ___(___()) %>% 
  ___(___(), num_comp = ___) 

# Fit a workflow with a default linear_reg() model spec
house_sales_fit <- ___(preprocessor = ___, spec = ___()) %>% 
  ___(___)

# Create prediction df for the test set
house_sales_pred_df <- ___(___, test) %>% 
  ___(test %>% select(___))

# Calculate the RMSE
___(house_sales_pred_df, ___, .pred)
Kodu Düzenle ve Çalıştır