Histogramlar
loan_data veri kümesi çalışma alanına yüklü. Daha önce kategorik değişkenleri CrossTable() fonksiyonuyla incelemiştin. Şimdi olası aykırı değerleri veya beklenmedik veri yapıları belirlemek için sürekli değişkenleri keşfetmek istiyorsun.
Bunu yapmak için, farklı müşteriler için kredi sayısının dağılımını anlamak amacıyla hist() fonksiyonunu deneyelim.
Bu egzersiz, kursun bir parçasıdır
R ile Kredi Riski Modellemesi
Egzersiz talimatları
- Sadece bir argümanla hist() kullanarak bir histogram oluştur:
loan_data$loan_amnt. Sonucuhist_1adlı yeni bir nesneye ata. - Histogram aralıkları hakkında daha fazla bilgi almak için
hist_1nesnesiyle birlikte$breakskullan. Aralıkların konumunu bilmek önemlidir; kötü seçilirlerse histogram yanıltıcı olabilir. hist_1içindeki aralık sayısınıbreaksargümanını belirterek 200'e çıkar. Ayrıca x eksenini"Loan amount"olarakxlabargümanıyla adlandır ve başlığı"Histogram of the loan amount"olarakmainargümanıyla ver. Sonucuhist_2olarak kaydet. Neden zirveler bulundukları yerlerde oluşuyor?
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create histogram of loan_amnt: hist_1
# Print locations of the breaks in hist_1
# Change number of breaks and add labels: hist_2
hist_2 <- hist(loan_data$loan_amnt, breaks = ___, xlab = "___",
main = "___")