Menjelajahi data kredit
Kita akan menelaah himpunan data loan_data yang dibahas dalam video sepanjang latihan di kursus ini.
Setelah diberikan loan_data, Anda khususnya tertarik pada pinjaman yang gagal bayar dalam himpunan data tersebut. Anda ingin mengetahui jumlah dan persentase gagal bayar. Gagal bayar jarang terjadi, sehingga Anda selalu perlu memeriksa proporsinya dalam suatu himpunan data pinjaman. Fungsi CrossTable() sangat berguna untuk ini.
Ingat bahwa informasi gagal bayar disimpan dalam variabel respons loan_status, di mana 1 merepresentasikan default (gagal bayar), dan 0 merepresentasikan non-default (tidak gagal bayar).
Untuk mempelajari lebih lanjut struktur variabel dan menemukan kecenderungan yang tidak terduga dalam data, Anda sebaiknya menelaah hubungan antara loan_status dan variabel bertipe factor tertentu. Misalnya, Anda akan memperkirakan bahwa proporsi gagal bayar pada kelompok nasabah dengan grade G (skor peringkat kredit terburuk) secara signifikan lebih tinggi dibandingkan proporsi gagal bayar pada kelompok grade A (skor peringkat kredit terbaik).
Untungnya, CrossTable() juga dapat diterapkan pada dua variabel kategorikal. Mari kita eksplorasi!
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Kenali himpunan data dengan melihat strukturnya menggunakan
str(). - Muat paket gmodels menggunakan
library(). Paket ini sudah terpasang di server DataCamp. - Lihat
CrossTable()untuk status pinjaman, dengan satu argumen saja:loan_data$loan_status. - Panggil
CrossTable()dengan argumenxberupaloan_data$gradedan argumenyberupaloan_data$loan_status.Kita hanya memerlukan proporsi per baris, jadi aturprop.rkeTRUE, tetapiprop.c,prop.t, danprop.chisqkeFALSE(nilai default di sini adalahTRUE, yang akan menyertakan proporsi kolom, proporsi tabel, dan kontribusi chi-square untuk setiap sel. Kita tidak memerlukan itu di sini.)
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View the structure of loan_data
# Load the gmodels package
# Call CrossTable() on loan_status
# Call CrossTable() on grade and loan_status