BaşlayınÜcretsiz Başlayın

Değiştirilmiş önsel olasılıklarla ağacı budama

Videoda, aşırı öğrenmeyi önlemek için bir ağacı budamanın gerekli olduğunu öğrendin. Önceki egzersizlerde oldukça büyük ağaçlar vardı ve şimdi öğrendiklerini uygulayarak, önsel olasılıkları değiştirilen önceki ağacı budayacaksın. rpart paketi çalışma alanında zaten yüklü.

Önce, videoda da belirtildiği gibi, sonuçların yeniden üretilebilir olması için bir tohum (seed) belirleyeceksin; çünkü çapraz doğrulama hata sonuçlarını inceleyeceksin. Sonuçlar rastgeleliğe bağlıdır ve farklı bir seed ile fonksiyonu tekrar çalıştırdığında biraz farklılık gösterebilir.

Bu egzersizde, hangi karmaşıklık parametresinin (CP) çapraz doğrulama hatasını en aza indirdiğini belirlemeyi, ardından ağacını bu değere göre budamayı öğreneceksin.

Bu egzersiz

R ile Kredi Riski Modellemesi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • tree_prior çalışma alanında yüklü.
  • tree_prior için karmaşıklık parametresi ile çapraz doğrulama hatası (X-val Relative Error) ilişkisini görselleştirmek üzere plotcp() kullan.
  • CP, bölünmeler ve hatalarla ilgili bir bilgi tablosu yazdırmak için printcp() kullan. tree_prior içinde en düşük çapraz doğrulama hatasına sahip bölünmeyi belirleyip belirleyemeyeceğine bak.
  • tree_prior$cptable içinde en düşük çapraz doğrulama hatası "xerror" değerine sahip satırı belirlemek için which.min() kullan. Bunu index değişkenine ata.
  • tree_prior$cptable tablosunda "CP" sütunundan, ilgili indeksi seçerek tree_min oluştur.
  • Budanmış ağacı elde etmek için prune() fonksiyonunu kullan. Budanmış ağacı ptree_prior olarak adlandır.
  • rpart.plot paketi çalışma alanında yüklü. Budanmış ağacı prp() (varsayılan ayarlar) fonksiyonuyla görselleştir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# tree_prior is loaded in your workspace

# Plot the cross-validated error rate as a function of the complexity parameter


# Use printcp() to identify for which complexity parameter the cross-validated error rate is minimized.


# Create an index for of the row with the minimum xerror
index <- which.min(___$___[ , "xerror"])

# Create tree_min
tree_min <- tree_prior$cptable[index, "CP"]

#  Prune the tree using tree_min
ptree_prior <- prune(___, cp = ___)

# Use prp() to plot the pruned tree
Kodu Düzenle ve Çalıştır