BaşlayınÜcretsiz Başlayın

Kategorik kodlamalar

İş arkadaşın, kredi veri setindeki sütunları LabelEncoder() kullanarak sayısal değerlere dönüştürdü. Ancak birini atladı: başvuranın kredi geçmişini tutan credit_history. Karşılaştırma yapmak için iki sürüm oluşturmak istiyorsun: biri LabelEncoder() kullansın, diğeri one-hot encoding kullansın. Özellik matrisi credit olarak hazır. LabelEncoder() önceden yüklü ve pandas da pd olarak mevcut.

Bu egzersiz

Python'da Machine Learning İş Akışları Tasarlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • credit_history sütununu LabelEncoder() ile kodla.
  • Sonucu orijinal çerçeveyle birleştir.
  • 1-hot encoding ile oluşturulan dummylari orijinal çerçeveyle birleştirerek yeni bir veri çerçevesi oluştur.
  • 1-hot encoding'in, label encoding'den daha fazla sütun ürettiğini doğrula.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create numeric encoding for credit_history
credit_history_num = ____.____(
  credit[____])

# Create a new feature matrix including the numeric encoding
X_num = pd.concat([X, pd.Series(____)], ____)

# Create new feature matrix with dummies for credit_history
X_hot = pd.concat(
  [X, ____.____(credit[____])], ____)

# Compare the number of features of the resulting DataFrames
print(X_hot.shape[____] > X_num.shape[____])
Kodu Düzenle ve Çalıştır