BaşlayınÜcretsiz Başlayın

Eksik kredi verilerini değiştirme

Şimdi eksik verileri kontrol etmelisin. Eğer loan_status içinde eksik veri bulursan, bu veriyi temerrüt olasılığını tahmin etmek için kullanamazsın; çünkü kredinin temerrüt olup olmadığını bilemezsin. person_emp_length içindeki eksik veriler o kadar yıkıcı olmaz, ama yine de eğitim hatalarına yol açabilir.

Bu yüzden, person_emp_length sütunundaki eksik verileri kontrol et ve eksik değerleri medyan ile değiştir.

cr_loan veri kümesi çalışma alanına yüklendi.

Bu egzersiz

Python ile Kredi Riski Modellemesi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Eksik veri içeren sütun adlarının bir dizisini .isnull() kullanarak yazdır.
  • person_emp_length için eksik veri içeren veri kümesinin ilk beş satırını yazdır.
  • Eksik verileri, tüm istihdam süresinin medyanı ile .fillna() kullanarak değiştir.
  • Dağılımı kontrol etmek için person_emp_length sütununun bir histogramını oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Print a null value column array
print(____.columns[____.____().any()])

# Print the top five rows with nulls for employment length
print(____[____[____].____()].head())

# Impute the null values with the median value for all employment lengths
____[____].____((cr_loan['person_emp_length'].____()), inplace=True)

# Create a histogram of employment length
n, bins, patches = plt.____(____[____], bins='auto', color='blue')
plt.xlabel("Person Employment Length")
plt.____()
Kodu Düzenle ve Çalıştır