Değiştirilmiş önsel olasılıklarla ağacı budama
Videoda, aşırı öğrenmeyi önlemek için bir ağacı budamanın gerekli olduğunu öğrendin. Önceki egzersizlerde oldukça büyük ağaçlar vardı ve şimdi öğrendiklerini uygulayarak, önsel olasılıkları değiştirilen önceki ağacı budayacaksın. rpart paketi çalışma alanında zaten yüklü.
Önce, videoda da belirtildiği gibi, sonuçların yeniden üretilebilir olması için bir tohum (seed) belirleyeceksin; çünkü çapraz doğrulama hata sonuçlarını inceleyeceksin. Sonuçlar rastgeleliğe bağlıdır ve farklı bir seed ile fonksiyonu tekrar çalıştırdığında biraz farklılık gösterebilir.
Bu egzersizde, hangi karmaşıklık parametresinin (CP) çapraz doğrulama hatasını en aza indirdiğini belirlemeyi, ardından ağacını bu değere göre budamayı öğreneceksin.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
tree_priorçalışma alanında yüklü.tree_prioriçin karmaşıklık parametresi ile çapraz doğrulama hatası (X-val Relative Error) ilişkisini görselleştirmek üzereplotcp()kullan.- CP, bölünmeler ve hatalarla ilgili bir bilgi tablosu yazdırmak için
printcp()kullan.tree_prioriçinde en düşük çapraz doğrulama hatasına sahip bölünmeyi belirleyip belirleyemeyeceğine bak. tree_prior$cptableiçinde en düşük çapraz doğrulama hatası"xerror"değerine sahip satırı belirlemek içinwhich.min()kullan. Bunuindexdeğişkenine ata.tree_prior$cptabletablosunda"CP"sütunundan, ilgili indeksi seçerektree_minoluştur.- Budanmış ağacı elde etmek için
prune()fonksiyonunu kullan. Budanmış ağacıptree_priorolarak adlandır. rpart.plotpaketi çalışma alanında yüklü. Budanmış ağacı prp() (varsayılan ayarlar) fonksiyonuyla görselleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# tree_prior is loaded in your workspace
# Plot the cross-validated error rate as a function of the complexity parameter
# Use printcp() to identify for which complexity parameter the cross-validated error rate is minimized.
# Create an index for of the row with the minimum xerror
index <- which.min(___$___[ , "xerror"])
# Create tree_min
tree_min <- tree_prior$cptable[index, "CP"]
# Prune the tree using tree_min
ptree_prior <- prune(___, cp = ___)
# Use prp() to plot the pruned tree