Membuat pohon yang dipangkas dengan baik
Menghentikan pertumbuhan pohon sebelum maksimal dapat membuatnya mengabaikan beberapa aspek data atau melewatkan pola penting yang mungkin baru ditemukan kemudian.
Dengan menggunakan post-pruning, Anda dapat dengan sengaja menumbuhkan pohon yang besar dan kompleks, lalu memangkasnya agar lebih kecil dan efisien di tahap berikutnya.
Dalam latihan ini, Anda akan berkesempatan membuat visualisasi kinerja pohon terhadap kompleksitas, dan menggunakan informasi tersebut untuk memangkas pohon ke tingkat yang sesuai.
Paket rpart telah dimuat sebelumnya, beserta loans_test dan loans_train.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Gunakan semua variabel pelamar dan tanpa pre-pruning untuk membuat pohon yang terlalu kompleks. Pastikan menetapkan
cp = 0dirpart.control()untuk mencegah pre-pruning. - Buat plot kompleksitas dengan menggunakan
plotcp()pada model. - Berdasarkan plot kompleksitas, pangkas pohon hingga kompleksitas 0.0014 menggunakan fungsi
prune()dengan pohon dan parameter kompleksitasnya. - Bandingkan akurasi pohon yang dipangkas dengan akurasi awal 58,3%. Untuk menghitung akurasi gunakan fungsi
predict()danmean().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)