BaşlayınÜcretsiz Başlayın

Kredi verilerinde one-hot encoding

LogisticRegression() modeline eklenebilmeleri için artık sayısal olmayan sütunları hazırlama zamanı.

Yeni sütunları one-hot encoding ile oluşturduktan sonra, bunları sayısal sütunlarla birleştirerek temerrüt olasılığını tahmin etmek için kurs boyunca kullanacağın yeni bir veri çerçevesi oluşturabilirsin.

Sadece sayısal olmayan sütunları one-hot encode etmeyi unutma. Bunu sayısal sütunlara uygulamak aşırı geniş bir veri kümesi yaratır!

Kredi kredi verisi cr_loan_clean çalışma alanına zaten yüklendi.

Bu egzersiz

Python ile Kredi Riski Modellemesi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Tüm sayısal sütunlar için cred_num, sayısal olmayan sütunlar için cred_str adında veri kümeleri oluştur.
  • cred_str üzerinde one-hot encoding uygula ve cred_str_onehot adlı yeni bir veri kümesi oluştur.
  • cred_num ile yeni one-hot kodlanmış veriyi birleştir ve sonucu cr_loan_prep olarak kaydet.
  • Yeni veri kümesinin sütunlarını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create two data sets for numeric and non-numeric data
____ = ____.select_dtypes(exclude=['object'])
____ = ____.select_dtypes(include=['object'])

# One-hot encode the non-numeric columns
____ = pd.____(____)

# Union the one-hot encoded columns to the numeric ones
____ = pd.concat([____, ____], axis=1)

# Print the columns in the new data set
print(____.columns)
Kodu Düzenle ve Çalıştır