Membangun dan mengevaluasi pohon yang lebih besar
Sebelumnya, Anda membuat pohon keputusan sederhana yang menggunakan skor kredit pemohon dan jumlah pinjaman yang diminta untuk memprediksi hasil pinjaman.
Lending Club memiliki informasi tambahan tentang para pemohon, seperti status kepemilikan rumah, lama masa kerja, tujuan pinjaman, dan riwayat kebangkrutan, yang mungkin berguna untuk membuat prediksi yang lebih akurat.
Dengan menggunakan semua data pemohon yang tersedia, bangun model pemberian pinjaman yang lebih canggih menggunakan himpunan data pelatihan acak yang telah dibuat sebelumnya. Lalu, gunakan model ini untuk membuat prediksi pada himpunan data pengujian guna memperkirakan kinerja model pada aplikasi pinjaman di masa mendatang.
Paket rpart telah dimuat sebelumnya, dan himpunan data loans_train serta loans_test telah disiapkan.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Gunakan
rpart()untuk membangun model pinjaman menggunakan himpunan data pelatihan dan semua prediktor yang tersedia. Sekali lagi, biarkan argumencontrolapa adanya. - Dengan menerapkan fungsi
predict()pada himpunan data pengujian, buat sebuah vektor keluaran terprediksi. Jangan lupa argumentype. - Buat
table()untuk membandingkan nilai terprediksi dengan nilaioutcomeyang aktual. - Hitung akurasi prediksi menggunakan fungsi
mean().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make predictions on the test dataset
loans_test$pred <- ___
# Examine the confusion matrix
table(___, ___)
# Compute the accuracy on the test dataset
mean(___)