Belirli sütunlar için one-hot encoding
Yerel bir ikinci el araç galerisi, araçlarının satış fiyatını tahmin etmen için senden yardım istiyor. Tüm used_cars veri kümesine one-hot encoding uygularsan, yeni veri kümesi 1.200’den fazla sütuna sahip oluyor. Bu durumun, fiyat tahmini için Machine Learning modellerini eğitirken sorun yaratabileceğinden endişe ediyorsun. Daha basit bir yaklaşım denemeye ve sadece birkaç sütunda one-hot encoding kullanmaya karar verdin.
Bu egzersiz
Python'da Kategorik Verilerle Çalışma
kursunun bir parçasıdırEgzersiz talimatları
"manufacturer_name"ve"transmission"(bu sırayla) sütunları için one-hot encoding içeren yeni bir veri kümesiused_cars_simpleoluştur.- Yeni eklenen sütunları kolayca filtreleyebilmek için tüm yeni sütunların önekini
"dummy"olarak ayarla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create one-hot encoding for just two columns
used_cars_simple = pd.____(
used_cars,
# Specify the columns from the instructions
____,
# Set the prefix
____
)
# Print the shape of the new dataset
print(used_cars_simple.shape)