MulaiMulai sekarang secara gratis

Membuat model yang lebih diskriminatif

Pada latihan sebelumnya, rentang probabilitas gagal bayar yang diprediksi cukup kecil. Seperti dibahas, probabilitas gagal bayar yang kecil memang wajar ketika tingkat gagal bayar rendah, tetapi membangun model yang lebih besar (yang pada dasarnya berarti: memasukkan lebih banyak prediktor) dapat memperluas rentang prediksi Anda.

Apakah hal ini pada akhirnya akan menghasilkan prediksi yang lebih baik masih perlu divalidasi dan bergantung pada kualitas prediktor yang baru dimasukkan. Namun terlebih dahulu, perhatikan bagaimana model yang lebih besar dapat memperluas rentangnya.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Buat log_model_full dengan cara yang sama seperti Anda membuat log_model_small, tetapi kali ini, sertakan semua prediktor yang tersedia dalam himpunan data. Jika Anda tidak ingin mengetik nama setiap kolom satu per satu, Anda dapat memilih semua variabel dengan loan_status ~ .
  • Buat vektor prediksi predictions_all_full untuk semua kasus dalam himpunan uji menggunakan predict(). Perhatikan bahwa nilai-nilai ini merepresentasikan probabilitas gagal bayar.
  • Lihat rentang dari prediksi tersebut.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)

# Make PD-predictions for all test set elements using the the full logistic regression model


# Look at the predictions range

Edit dan Jalankan Kode