Özellik önemlerini kullanarak veriyi küçült
Artık tam bir random forest modeli oluşturduğuna göre, özellik önemlerini inceleyeceksin.
Random forest modelleri doğal olarak — ama örtük bir şekilde — özellik seçimi yapsa da, çoğu zaman azaltılmış bir model kurmak avantajlıdır. Azaltılmış bir model daha hızlı eğitilir, daha hızlı tahmin üretir ve anlaması ile yönetmesi daha kolaydır. Elbette model sadeliği ile model performansı arasında her zaman bir denge vardır.
Bu egzersizde veri kümesini küçülteceksin. Sonraki egzersizde, azaltılmış bir modeli eğitip performansını tam modelle karşılaştıracaksın. rf_fit, train ve test senin için hazırlandı.
tidyverse, tidymodels ve vip paketleri yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- En önemli on özelliği çıkarmak için
rankparametresiylevi()kullan. - Hedef değişkeni tekrar en iyi özellikler listesine ekle.
- En iyi özellik maskesini uygulayarak veri kümelerini küçült.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract the top ten features
top_features <- ___ %>%
___(___ = ___) %>%
filter(___) %>%
pull(Variable)
# Add the target variable to the feature list
top_features <- c(___, "___")
# Reduce and print the data sets
train_reduced <- train[___]
test_reduced <- ___[___]
train_reduced %>% head(5)
test_reduced %>% head(5)