Memangkas pohon dengan matriks kerugian
Dalam latihan ini, Anda akan memangkas pohon yang dibangun menggunakan matriks kerugian untuk memberikan penalti yang lebih besar pada kesalahan klasifikasi default dibandingkan dengan kesalahan klasifikasi non-default.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Jalankan kode untuk menetapkan seed dan menyusun kembali
tree_loss_matrix. - Gunakan fungsi plotcp() untuk menelaah struktur galat tervalidasi-silang.
- Dengan melihat cp-plot, Anda akan melihat bahwa memangkas pohon menggunakan galat tervalidasi-silang minimum akan menghasilkan pohon sebesar pohon yang tidak dipangkas, karena galat tervalidasi-silang mencapai minimum pada
cp = 0.001. Karena Anda ingin membuat pohon sedikit lebih kecil, coba pangkas pohon dengancp = 0.0012788. Untuk parameter kompleksitas ini, galat tervalidasi-silang mendekati galat minimum yang teramati. Beri nama pohon yang telah dipangkas tersebutptree_loss_matrix. - Paket
rpart.plotsudah dimuat di workspace Anda. Plot pohon yang telah dipangkas menggunakan fungsiprp()(sertakan argumenextra = 1).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# set a seed and run the code to construct the tree with the loss matrix again
set.seed(345)
tree_loss_matrix <- rpart(loan_status ~ ., method = "class", data = training_set,
parms = list(loss=matrix(c(0, 10, 1, 0), ncol = 2)),
control = rpart.control(cp = 0.001))
# Plot the cross-validated error rate as a function of the complexity parameter
# Prune the tree using cp = 0.0012788
# Use prp() and argument extra = 1 to plot the pruned tree