Membangun pohon keputusan sederhana
Himpunan data loans berisi 11.312 orang yang dipilih secara acak yang mengajukan dan kemudian menerima pinjaman dari Lending Club, sebuah perusahaan pinjaman peer-to-peer berbasis di AS.
Anda akan menggunakan pohon keputusan untuk mempelajari pola pada hasil pinjaman ini (lunas atau gagal bayar) berdasarkan jumlah pinjaman yang diminta dan skor kredit saat pengajuan.
Kemudian, lihat bagaimana prediksi pohon berbeda untuk pemohon dengan kredit baik dibandingkan dengan yang berkredit buruk.
Himpunan data loans telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Klasifikasi
Petunjuk latihan
- Muat paket
rpart. - Latih model pohon keputusan dengan fungsi
rpart().- Berikan formula R yang menyatakan
outcomesebagai fungsi dariloan_amountdancredit_scoresebagai argumen pertama. - Biarkan argumen
controlapa adanya untuk sekarang. (Anda akan mempelajari lebih lanjut tentang itu nanti!)
- Berikan formula R yang menyatakan
- Gunakan
predict()dengan model pinjaman yang dihasilkan untuk memprediksi hasil bagi pemohongood_credit. Gunakan argumentypeuntuk memprediksi"class"dari hasil. - Lakukan hal yang sama untuk pemohon
bad_credit.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit