Kategorik kodlamalar
İş arkadaşın, kredi veri setindeki sütunları LabelEncoder() kullanarak sayısal değerlere dönüştürdü. Ancak birini atladı: başvuranın kredi geçmişini tutan credit_history. Karşılaştırma yapmak için iki sürüm oluşturmak istiyorsun: biri LabelEncoder() kullansın, diğeri one-hot encoding kullansın. Özellik matrisi credit olarak hazır. LabelEncoder() önceden yüklü ve pandas da pd olarak mevcut.
Bu egzersiz, kursun bir parçasıdır
Python'da Machine Learning İş Akışları Tasarlama
Egzersiz talimatları
credit_historysütununuLabelEncoder()ile kodla.- Sonucu orijinal çerçeveyle birleştir.
- 1-hot encoding ile oluşturulan dummylari orijinal çerçeveyle birleştirerek yeni bir veri çerçevesi oluştur.
- 1-hot encoding'in, label encoding'den daha fazla sütun ürettiğini doğrula.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create numeric encoding for credit_history
credit_history_num = ____.____(
credit[____])
# Create a new feature matrix including the numeric encoding
X_num = pd.concat([X, pd.Series(____)], ____)
# Create new feature matrix with dummies for credit_history
X_hot = pd.concat(
[X, ____.____(credit[____])], ____)
# Compare the number of features of the resulting DataFrames
print(X_hot.shape[____] > X_num.shape[____])