tidymodels ile PCA
Model kurma açısından PCA, daha az özellikle modeller oluşturmanı sağlar ama yine de orijinal verideki bilginin çoğunu yakalar. Ancak gördüğün gibi PCA'nın bir dezavantajı, modeli yorumlamanın zor olmasıdır. Bu egzersizde, ev satışları verisinin bir alt kümesini kullanarak doğrusal regresyon modeli kurmaya odaklanacaksın. Hedef değişken price.
Bileşen çıkarmadan, veriden doğrudan kurulan bir modelin RMSE değeri $236,461.4. tidymodels ile PCA uygulayıp yeni RMSE'yi karşılaştıracaksın. Unutma, daha düşük RMSE daha iyidir.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
R'de Boyutsal Azaltma
Egzersiz talimatları
- Beş temel bileşen çıkarmak için
trainüzerinde bir PCA tarifi (recipe) oluştur. - Varsayılan
linear_reg()model tanımıyla bir workflow uydur. testkullanarak, gerçek ve tahmin değerlerini içeren bir test tahmin veri çerçevesi oluştur.- PCA ile azaltılmış doğrusal regresyon modeli için RMSE'yi hesapla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Build a PCA recipe
pca_recipe <- ___(___ ~ ___ , data = ___) %>%
___(___()) %>%
___(___(), num_comp = ___)
# Fit a workflow with a default linear_reg() model spec
house_sales_fit <- ___(preprocessor = ___, spec = ___()) %>%
___(___)
# Create prediction df for the test set
house_sales_pred_df <- ___(___, test) %>%
___(test %>% select(___))
# Calculate the RMSE
___(house_sales_pred_df, ___, .pred)