MulaiMulai sekarang secara gratis

Menjelajahi data kredit

Kita akan menelaah himpunan data loan_data yang dibahas dalam video sepanjang latihan di kursus ini.

Setelah diberikan loan_data, Anda khususnya tertarik pada pinjaman yang gagal bayar dalam himpunan data tersebut. Anda ingin mengetahui jumlah dan persentase gagal bayar. Gagal bayar jarang terjadi, sehingga Anda selalu perlu memeriksa proporsinya dalam suatu himpunan data pinjaman. Fungsi CrossTable() sangat berguna untuk ini.

Ingat bahwa informasi gagal bayar disimpan dalam variabel respons loan_status, di mana 1 merepresentasikan default (gagal bayar), dan 0 merepresentasikan non-default (tidak gagal bayar).

Untuk mempelajari lebih lanjut struktur variabel dan menemukan kecenderungan yang tidak terduga dalam data, Anda sebaiknya menelaah hubungan antara loan_status dan variabel bertipe factor tertentu. Misalnya, Anda akan memperkirakan bahwa proporsi gagal bayar pada kelompok nasabah dengan grade G (skor peringkat kredit terburuk) secara signifikan lebih tinggi dibandingkan proporsi gagal bayar pada kelompok grade A (skor peringkat kredit terbaik).

Untungnya, CrossTable() juga dapat diterapkan pada dua variabel kategorikal. Mari kita eksplorasi!

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Kenali himpunan data dengan melihat strukturnya menggunakan str().
  • Muat paket gmodels menggunakan library(). Paket ini sudah terpasang di server DataCamp.
  • Lihat CrossTable() untuk status pinjaman, dengan satu argumen saja: loan_data$loan_status.
  • Panggil CrossTable() dengan argumen x berupa loan_data$grade dan argumen y berupa loan_data$loan_status. Kita hanya memerlukan proporsi per baris, jadi atur prop.r ke TRUE, tetapi prop.c, prop.t, dan prop.chisq ke FALSE (nilai default di sini adalah TRUE, yang akan menyertakan proporsi kolom, proporsi tabel, dan kontribusi chi-square untuk setiap sel. Kita tidak memerlukan itu di sini.)

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# View the structure of loan_data


# Load the gmodels package 


# Call CrossTable() on loan_status


# Call CrossTable() on grade and loan_status

Edit dan Jalankan Kode