Daha fazla seçenekle son bir ağaç
Bu egzersizde, videoda bahsedilen bazı son argümanları kullanacaksın. rpart.control() fonksiyonundaki bazı ayarlar değiştirilecek ve rpart() içinde weights argümanını kullanarak ağırlıklar eklenecek. case_weights vektörü senin için oluşturuldu ve çalışma alanına yüklendi. Bu vektör, eğitim setindeki temerrüt olmayanlar için 1, temerrüt edenler için 3 ağırlık içerir. Temerrüt sınıfına daha yüksek ağırlık vererek, model temerrütleri doğru sınıflandırmaya daha fazla önem atfeder.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Tohumu 345 olarak ayarla.
- Verilen koda
case_weights'irpart()fonksiyonununweightsargümanına geçirerek ekleme yap. rpart.controliçindeminsplitveminbucketargümanlarını kullanarak bir düğümde izin verilen minimum bölünme sayısını 5, yaprak düğümlerde izin verilen minimum gözlem sayısını 2 olacak şekilde değiştir.- Çapraz doğrulamalı hata oranının en aza indirilebileceği yeri incelemek için plotcp() fonksiyonunu kullan.
which.min()iletree_weights$cpiçindeki minimum"xerror"değerine sahip satırı belirle. Bunuindexdeğişkenine ata.- Sağlanan kodu kullanarak çapraz doğrulamalı hatanın en aza indiği
cpdeğerini seç. - Çapraz doğrulamalı hata oranının en aza indiği karmaşıklık parametresini kullanarak ağacı buda. Budanmış ağacı
ptree_weightsiçinde sakla. - Budanmış ağacı
prp()fonksiyonuyla görselleştir. İkinci bir argüman olarakextraekle ve değerini 1 yap.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# set a seed and run the code to obtain a tree using weights, minsplit and minbucket
set.seed(345)
tree_weights <- rpart(loan_status ~ ., method = "class",
data = training_set,
control = rpart.control(minsplit = ___, minbucket = ___, cp = 0.001))
# Plot the cross-validated error rate for a changing cp
# Create an index for of the row with the minimum xerror
index <- which.min(___$___[ , "xerror"])
# Create tree_min
tree_min <- tree_weights$cp[index, "CP"]
# Prune the tree using tree_min
# Plot the pruned tree using the rpart.plot()-package