BaşlayınÜcretsiz Başlayın

Belirli sütunlar için one-hot encoding

Yerel bir ikinci el araç galerisi, araçlarının satış fiyatını tahmin etmen için senden yardım istiyor. Tüm used_cars veri kümesine one-hot encoding uygularsan, yeni veri kümesi 1.200’den fazla sütuna sahip oluyor. Bu durumun, fiyat tahmini için Machine Learning modellerini eğitirken sorun yaratabileceğinden endişe ediyorsun. Daha basit bir yaklaşım denemeye ve sadece birkaç sütunda one-hot encoding kullanmaya karar verdin.

Bu egzersiz

Python'da Kategorik Verilerle Çalışma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • "manufacturer_name" ve "transmission" (bu sırayla) sütunları için one-hot encoding içeren yeni bir veri kümesi used_cars_simple oluştur.
  • Yeni eklenen sütunları kolayca filtreleyebilmek için tüm yeni sütunların önekini "dummy" olarak ayarla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create one-hot encoding for just two columns
used_cars_simple = pd.____(
  used_cars,
  # Specify the columns from the instructions
  ____,
  # Set the prefix
  ____
)

# Print the shape of the new dataset
print(used_cars_simple.shape)
Kodu Düzenle ve Çalıştır