Histogramlar
loan_data veri kümesi çalışma alanına yüklü. Daha önce kategorik değişkenleri CrossTable() fonksiyonuyla incelemiştin. Şimdi olası aykırı değerleri veya beklenmedik veri yapıları belirlemek için sürekli değişkenleri keşfetmek istiyorsun.
Bunu yapmak için, farklı müşteriler için kredi sayısının dağılımını anlamak amacıyla hist() fonksiyonunu deneyelim.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Sadece bir argümanla hist() kullanarak bir histogram oluştur:
loan_data$loan_amnt. Sonucuhist_1adlı yeni bir nesneye ata. - Histogram aralıkları hakkında daha fazla bilgi almak için
hist_1nesnesiyle birlikte$breakskullan. Aralıkların konumunu bilmek önemlidir; kötü seçilirlerse histogram yanıltıcı olabilir. hist_1içindeki aralık sayısınıbreaksargümanını belirterek 200'e çıkar. Ayrıca x eksenini"Loan amount"olarakxlabargümanıyla adlandır ve başlığı"Histogram of the loan amount"olarakmainargümanıyla ver. Sonucuhist_2olarak kaydet. Neden zirveler bulundukları yerlerde oluşuyor?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create histogram of loan_amnt: hist_1
# Print locations of the breaks in hist_1
# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___",
main = "___")