Histogram
Himpunan data loan_data sudah dimuat di workspace Anda. Sebelumnya Anda mengeksplorasi variabel kategorikal menggunakan fungsi CrossTable(). Sekarang Anda ingin mengeksplorasi variabel kontinu untuk mengidentifikasi potensi pencilan atau struktur data yang tidak terduga.
Untuk itu, mari bereksperimen dengan fungsi hist() untuk memahami distribusi jumlah pinjaman untuk berbagai nasabah.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit di R
Petunjuk latihan
- Gunakan hist() untuk membuat histogram dengan satu argumen saja:
loan_data$loan_amnt. Simpan hasilnya ke objek baru bernamahist_1. - Gunakan
$breaksbersama objekhist_1untuk mendapatkan informasi lebih lanjut tentang titik batas (breaks) histogram. Mengetahui letak breaks itu penting karena jika dipilih dengan buruk, histogram bisa menyesatkan. - Ubah jumlah breaks pada
hist_1menjadi 200 dengan menentukan argumenbreaks. Selain itu, beri nama sumbu-x"Loan amount"menggunakan argumenxlabdan juduli"Histogram of the loan amount"menggunakan argumenmain. Simpan hasilnya kehist_2. Mengapa puncak-puncak muncul pada lokasi tersebut?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create histogram of loan_amnt: hist_1
# Print locations of the breaks in hist_1
# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___",
main = "___")