MulaiMulai sekarang secara gratis

Membuat pohon yang dipangkas dengan baik

Menghentikan pertumbuhan pohon sebelum maksimal dapat membuatnya mengabaikan beberapa aspek data atau melewatkan pola penting yang mungkin baru ditemukan kemudian.

Dengan menggunakan post-pruning, Anda dapat dengan sengaja menumbuhkan pohon yang besar dan kompleks, lalu memangkasnya agar lebih kecil dan efisien di tahap berikutnya.

Dalam latihan ini, Anda akan berkesempatan membuat visualisasi kinerja pohon terhadap kompleksitas, dan menggunakan informasi tersebut untuk memangkas pohon ke tingkat yang sesuai.

Paket rpart telah dimuat sebelumnya, beserta loans_test dan loans_train.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Klasifikasi

Lihat Kursus

Petunjuk latihan

  • Gunakan semua variabel pelamar dan tanpa pre-pruning untuk membuat pohon yang terlalu kompleks. Pastikan menetapkan cp = 0 di rpart.control() untuk mencegah pre-pruning.
  • Buat plot kompleksitas dengan menggunakan plotcp() pada model.
  • Berdasarkan plot kompleksitas, pangkas pohon hingga kompleksitas 0.0014 menggunakan fungsi prune() dengan pohon dan parameter kompleksitasnya.
  • Bandingkan akurasi pohon yang dipangkas dengan akurasi awal 58,3%. Untuk menghitung akurasi gunakan fungsi predict() dan mean().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Grow an overly complex tree
loan_model <- ___

# Examine the complexity plot
plotcp(___)

# Prune the tree
loan_model_pruned <- ___(___, cp = ___)

# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)
Edit dan Jalankan Kode