MulaiMulai sekarang secara gratis

Histogram

Himpunan data loan_data sudah dimuat di workspace Anda. Sebelumnya Anda mengeksplorasi variabel kategorikal menggunakan fungsi CrossTable(). Sekarang Anda ingin mengeksplorasi variabel kontinu untuk mengidentifikasi potensi pencilan atau struktur data yang tidak terduga.

Untuk itu, mari bereksperimen dengan fungsi hist() untuk memahami distribusi jumlah pinjaman untuk berbagai nasabah.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit di R

Lihat Kursus

Petunjuk latihan

  • Gunakan hist() untuk membuat histogram dengan satu argumen saja: loan_data$loan_amnt. Simpan hasilnya ke objek baru bernama hist_1.
  • Gunakan $breaks bersama objek hist_1 untuk mendapatkan informasi lebih lanjut tentang titik batas (breaks) histogram. Mengetahui letak breaks itu penting karena jika dipilih dengan buruk, histogram bisa menyesatkan.
  • Ubah jumlah breaks pada hist_1 menjadi 200 dengan menentukan argumen breaks. Selain itu, beri nama sumbu-x "Loan amount" menggunakan argumen xlab dan juduli "Histogram of the loan amount" menggunakan argumen main. Simpan hasilnya ke hist_2. Mengapa puncak-puncak muncul pada lokasi tersebut?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create histogram of loan_amnt: hist_1


# Print locations of the breaks in hist_1


# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___", 
               main = "___")
Edit dan Jalankan Kode