MulaiMulai sekarang secara gratis

Membangun dan mengevaluasi pohon yang lebih besar

Sebelumnya, Anda membuat pohon keputusan sederhana yang menggunakan skor kredit pemohon dan jumlah pinjaman yang diminta untuk memprediksi hasil pinjaman.

Lending Club memiliki informasi tambahan tentang para pemohon, seperti status kepemilikan rumah, lama masa kerja, tujuan pinjaman, dan riwayat kebangkrutan, yang mungkin berguna untuk membuat prediksi yang lebih akurat.

Dengan menggunakan semua data pemohon yang tersedia, bangun model pemberian pinjaman yang lebih canggih menggunakan himpunan data pelatihan acak yang telah dibuat sebelumnya. Lalu, gunakan model ini untuk membuat prediksi pada himpunan data pengujian guna memperkirakan kinerja model pada aplikasi pinjaman di masa mendatang.

Paket rpart telah dimuat sebelumnya, dan himpunan data loans_train serta loans_test telah disiapkan.

Latihan ini adalah bagian dari kursus

Supervised Learning di R: Klasifikasi

Lihat Kursus

Petunjuk latihan

  • Gunakan rpart() untuk membangun model pinjaman menggunakan himpunan data pelatihan dan semua prediktor yang tersedia. Sekali lagi, biarkan argumen control apa adanya.
  • Dengan menerapkan fungsi predict() pada himpunan data pengujian, buat sebuah vektor keluaran terprediksi. Jangan lupa argumen type.
  • Buat table() untuk membandingkan nilai terprediksi dengan nilai outcome yang aktual.
  • Hitung akurasi prediksi menggunakan fungsi mean().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))

# Make predictions on the test dataset
loans_test$pred <- ___

# Examine the confusion matrix
table(___, ___)

# Compute the accuracy on the test dataset
mean(___)
Edit dan Jalankan Kode