MulaiMulai sekarang secara gratis

Memangkas pohon dengan matriks kerugian

Dalam latihan ini, Anda akan memangkas pohon yang dibangun menggunakan matriks kerugian untuk memberikan penalti yang lebih besar pada kesalahan klasifikasi default dibandingkan dengan kesalahan klasifikasi non-default.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Jalankan kode untuk menetapkan seed dan menyusun kembali tree_loss_matrix.
  • Gunakan fungsi plotcp() untuk menelaah struktur galat tervalidasi-silang.
  • Dengan melihat cp-plot, Anda akan melihat bahwa memangkas pohon menggunakan galat tervalidasi-silang minimum akan menghasilkan pohon sebesar pohon yang tidak dipangkas, karena galat tervalidasi-silang mencapai minimum pada cp = 0.001. Karena Anda ingin membuat pohon sedikit lebih kecil, coba pangkas pohon dengan cp = 0.0012788. Untuk parameter kompleksitas ini, galat tervalidasi-silang mendekati galat minimum yang teramati. Beri nama pohon yang telah dipangkas tersebut ptree_loss_matrix.
  • Paket rpart.plot sudah dimuat di workspace Anda. Plot pohon yang telah dipangkas menggunakan fungsi prp() (sertakan argumen extra = 1).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# set a seed and run the code to construct the tree with the loss matrix again
set.seed(345)
tree_loss_matrix  <- rpart(loan_status ~ ., method = "class", data = training_set,
                           parms = list(loss=matrix(c(0, 10, 1, 0), ncol = 2)),
                           control = rpart.control(cp = 0.001))

# Plot the cross-validated error rate as a function of the complexity parameter


# Prune the tree using cp = 0.0012788


# Use prp() and argument extra = 1 to plot the pruned tree
Edit dan Jalankan Kode