Kredi verilerinde one-hot encoding
LogisticRegression() modeline eklenebilmeleri için artık sayısal olmayan sütunları hazırlama zamanı.
Yeni sütunları one-hot encoding ile oluşturduktan sonra, bunları sayısal sütunlarla birleştirerek temerrüt olasılığını tahmin etmek için kurs boyunca kullanacağın yeni bir veri çerçevesi oluşturabilirsin.
Sadece sayısal olmayan sütunları one-hot encode etmeyi unutma. Bunu sayısal sütunlara uygulamak aşırı geniş bir veri kümesi yaratır!
Kredi kredi verisi cr_loan_clean çalışma alanına zaten yüklendi.
Bu egzersiz
Python ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Tüm sayısal sütunlar için
cred_num, sayısal olmayan sütunlar içincred_stradında veri kümeleri oluştur. cred_strüzerinde one-hot encoding uygula vecred_str_onehotadlı yeni bir veri kümesi oluştur.cred_numile yeni one-hot kodlanmış veriyi birleştir ve sonucucr_loan_prepolarak kaydet.- Yeni veri kümesinin sütunlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create two data sets for numeric and non-numeric data
____ = ____.select_dtypes(exclude=['object'])
____ = ____.select_dtypes(include=['object'])
# One-hot encode the non-numeric columns
____ = pd.____(____)
# Union the one-hot encoded columns to the numeric ones
____ = pd.concat([____, ____], axis=1)
# Print the columns in the new data set
print(____.columns)