tidymodels ile PCA
Model kurma açısından PCA, daha az özellikle modeller oluşturmanı sağlar ama yine de orijinal verideki bilginin çoğunu yakalar. Ancak gördüğün gibi PCA'nın bir dezavantajı, modeli yorumlamanın zor olmasıdır. Bu egzersizde, ev satışları verisinin bir alt kümesini kullanarak doğrusal regresyon modeli kurmaya odaklanacaksın. Hedef değişken price.
Bileşen çıkarmadan, veriden doğrudan kurulan bir modelin RMSE değeri $236,461.4. tidymodels ile PCA uygulayıp yeni RMSE'yi karşılaştıracaksın. Unutma, daha düşük RMSE daha iyidir.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- Beş temel bileşen çıkarmak için
trainüzerinde bir PCA tarifi (recipe) oluştur. - Varsayılan
linear_reg()model tanımıyla bir workflow uydur. testkullanarak, gerçek ve tahmin değerlerini içeren bir test tahmin veri çerçevesi oluştur.- PCA ile azaltılmış doğrusal regresyon modeli için RMSE'yi hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build a PCA recipe
pca_recipe <- ___(___ ~ ___ , data = ___) %>%
___(___()) %>%
___(___(), num_comp = ___)
# Fit a workflow with a default linear_reg() model spec
house_sales_fit <- ___(preprocessor = ___, spec = ___()) %>%
___(___)
# Create prediction df for the test set
house_sales_pred_df <- ___(___, test) %>%
___(test %>% select(___))
# Calculate the RMSE
___(house_sales_pred_df, ___, .pred)