Kayıp matrisi ile ağacı budama
Bu egzersizde, yanlış sınıflandırılan temerrütleri, yanlış sınıflandırılan temerrüt dışı durumlardan daha fazla cezalandırmak için bir kayıp matrisi kullanılarak kurulmuş ağacı budayacaksın.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Tohumu ayarlamak ve
tree_loss_matrixi yeniden oluşturmak için kodu çalıştır. - Çapraz doğrulama hatası yapısını incelemek için plotcp() fonksiyonunu kullan.
- cp grafiğine baktığında, minimum çapraz doğrulama hatasıyla budamanın, çapraz doğrulama hatası
cp = 0.001için minimuma ulaştığından, budanmamış ağaç kadar büyük bir ağaçla sonuçlanacağını fark edeceksin. Ağacı biraz daha küçük yapmak istediğin için,cp = 0.0012788kullanarak budamayı dene. Bu karmaşıklık parametresi için çapraz doğrulama hatası, gözlemlenen minimum hataya yaklaşır. Budanmış ağacıptree_loss_matrixolarak adlandır. rpart.plotpaketi çalışma alanına yüklü. Budanmış ağacıprp()fonksiyonunu kullanarak çiz (argümanextra = 1dahil).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# set a seed and run the code to construct the tree with the loss matrix again
set.seed(345)
tree_loss_matrix <- rpart(loan_status ~ ., method = "class", data = training_set,
parms = list(loss=matrix(c(0, 10, 1, 0), ncol = 2)),
control = rpart.control(cp = 0.001))
# Plot the cross-validated error rate as a function of the complexity parameter
# Prune the tree using cp = 0.0012788
# Use prp() and argument extra = 1 to plot the pruned tree