Kategorik kodlamalar
İş arkadaşın, kredi veri setindeki sütunları LabelEncoder() kullanarak sayısal değerlere dönüştürdü. Ancak birini atladı: başvuranın kredi geçmişini tutan credit_history. Karşılaştırma yapmak için iki sürüm oluşturmak istiyorsun: biri LabelEncoder() kullansın, diğeri one-hot encoding kullansın. Özellik matrisi credit olarak hazır. LabelEncoder() önceden yüklü ve pandas da pd olarak mevcut.
Bu egzersiz
Python'da Machine Learning İş Akışları Tasarlama
kursunun bir parçasıdırEgzersiz talimatları
credit_historysütununuLabelEncoder()ile kodla.- Sonucu orijinal çerçeveyle birleştir.
- 1-hot encoding ile oluşturulan dummylari orijinal çerçeveyle birleştirerek yeni bir veri çerçevesi oluştur.
- 1-hot encoding'in, label encoding'den daha fazla sütun ürettiğini doğrula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create numeric encoding for credit_history
credit_history_num = ____.____(
credit[____])
# Create a new feature matrix including the numeric encoding
X_num = pd.concat([X, pd.Series(____)], ____)
# Create new feature matrix with dummies for credit_history
X_hot = pd.concat(
[X, ____.____(credit[____])], ____)
# Compare the number of features of the resulting DataFrames
print(X_hot.shape[____] > X_num.shape[____])