Kayıp matrisi ile ağacı budama
Bu egzersizde, yanlış sınıflandırılan temerrütleri, yanlış sınıflandırılan temerrüt dışı durumlardan daha fazla cezalandırmak için bir kayıp matrisi kullanılarak kurulmuş ağacı budayacaksın.
Bu egzersiz, kursun bir parçasıdır
R ile Kredi Riski Modellemesi
Egzersiz talimatları
- Tohumu ayarlamak ve
tree_loss_matrixi yeniden oluşturmak için kodu çalıştır. - Çapraz doğrulama hatası yapısını incelemek için plotcp() fonksiyonunu kullan.
- cp grafiğine baktığında, minimum çapraz doğrulama hatasıyla budamanın, çapraz doğrulama hatası
cp = 0.001için minimuma ulaştığından, budanmamış ağaç kadar büyük bir ağaçla sonuçlanacağını fark edeceksin. Ağacı biraz daha küçük yapmak istediğin için,cp = 0.0012788kullanarak budamayı dene. Bu karmaşıklık parametresi için çapraz doğrulama hatası, gözlemlenen minimum hataya yaklaşır. Budanmış ağacıptree_loss_matrixolarak adlandır. rpart.plotpaketi çalışma alanına yüklü. Budanmış ağacıprp()fonksiyonunu kullanarak çiz (argümanextra = 1dahil).
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# set a seed and run the code to construct the tree with the loss matrix again
set.seed(345)
tree_loss_matrix <- rpart(loan_status ~ ., method = "class", data = training_set,
parms = list(loss=matrix(c(0, 10, 1, 0), ncol = 2)),
control = rpart.control(cp = 0.001))
# Plot the cross-validated error rate as a function of the complexity parameter
# Prune the tree using cp = 0.0012788
# Use prp() and argument extra = 1 to plot the pruned tree