BaşlayınÜcretsiz başlayın

Belirli sütunlar için one-hot encoding

Yerel bir ikinci el araç galerisi, araçlarının satış fiyatını tahmin etmen için senden yardım istiyor. Tüm used_cars veri kümesine one-hot encoding uygularsan, yeni veri kümesi 1.200’den fazla sütuna sahip oluyor. Bu durumun, fiyat tahmini için Machine Learning modellerini eğitirken sorun yaratabileceğinden endişe ediyorsun. Daha basit bir yaklaşım denemeye ve sadece birkaç sütunda one-hot encoding kullanmaya karar verdin.

Bu egzersiz, kursun bir parçasıdır

Python'da Kategorik Verilerle Çalışma

Kursa Göz Atın

Egzersiz talimatları

  • "manufacturer_name" ve "transmission" (bu sırayla) sütunları için one-hot encoding içeren yeni bir veri kümesi used_cars_simple oluştur.
  • Yeni eklenen sütunları kolayca filtreleyebilmek için tüm yeni sütunların önekini "dummy" olarak ayarla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create one-hot encoding for just two columns
used_cars_simple = pd.____(
  used_cars,
  # Specify the columns from the instructions
  ____,
  # Set the prefix
  ____
)

# Print the shape of the new dataset
print(used_cars_simple.shape)
Kodu Düzenle ve Çalıştır