Eksik kredi verilerini değiştirme
Şimdi eksik verileri kontrol etmelisin. Eğer loan_status içinde eksik veri bulursan, bu veriyi temerrüt olasılığını tahmin etmek için kullanamazsın; çünkü kredinin temerrüt olup olmadığını bilemezsin. person_emp_length içindeki eksik veriler o kadar yıkıcı olmaz, ama yine de eğitim hatalarına yol açabilir.
Bu yüzden, person_emp_length sütunundaki eksik verileri kontrol et ve eksik değerleri medyan ile değiştir.
cr_loan veri kümesi çalışma alanına yüklendi.
Bu egzersiz
Python ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Eksik veri içeren sütun adlarının bir dizisini
.isnull()kullanarak yazdır. person_emp_lengthiçin eksik veri içeren veri kümesinin ilk beş satırını yazdır.- Eksik verileri, tüm istihdam süresinin medyanı ile
.fillna()kullanarak değiştir. - Dağılımı kontrol etmek için
person_emp_lengthsütununun bir histogramını oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print a null value column array
print(____.columns[____.____().any()])
# Print the top five rows with nulls for employment length
print(____[____[____].____()].head())
# Impute the null values with the median value for all employment lengths
____[____].____((cr_loan['person_emp_length'].____()), inplace=True)
# Create a histogram of employment length
n, bins, patches = plt.____(____[____], bins='auto', color='blue')
plt.xlabel("Person Employment Length")
plt.____()