Değişken önemi
Bagging (torbalama) ağaçlarının, karar ağaçlarının varyans sorununu aşan bir topluluk (ensemble) modeli olduğunu zaten biliyorsun. Random forest algoritmasının ise her ağaçta yalnızca rastgele bir özellik altkümesini kullanarak bunu daha da geliştirdiğini öğrendin. Bu yaklaşım, topluluk üyeleri arasındaki korelasyonu daha da azaltır ve tahmin performansını artırır.
Bu egzersizde kendi random forest modelini kuracak ve vip paketini kullanarak değişkenlerin önemini görselleştireceksin. Eğitim verisi customers_train çalışma alanında önceden yüklü.
Bu egzersiz, kursun bir parçasıdır
R ile Ağaç Tabanlı Modellerle Machine Learning
Egzersiz talimatları
"ranger"motorunu ve"impurity"değişken önemini kullanarak bir random forest sınıflandırma modelinin belirtimi olanspec'i oluştur.still_customer'ı çıktı, diğer tüm sütunları ise tahmin değişkenleri olarak kullanıp tibblecustomers_train'ıspec'e uydurarakmodel'i oluştur.- Değişken önemini, önceden yüklenmemiş olan
vippaketindekivip()fonksiyonuyla görselleştir.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Specify a random forest
spec <- ___ %>%
set_mode("classification") %>%
set_engine(___, importance = ___)
# Train the forest
model <- spec %>%
fit(___,
___)
# Plot the variable importance
vip::___(model)