BaşlayınÜcretsiz Başlayın

Kategorik değişkenleri kodlama

UFO veri kümesinde, scikit-learn ile modellenecek hale gelmeden önce kodlanması gereken birkaç sütun var. Burada bu dönüşümü, hem ikili (binary) hem de tek-seçmeli (one-hot) kodlama yöntemlerini kullanarak yapacaksın.

Bu egzersiz

Python'da Machine Learning için Ön İşleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • apply() kullanarak, değer "us" ise 1, değilse 0 döndüren koşullu bir lambda fonksiyonu yaz.
  • type sütunundaki .unique() değerlerinin sayısını yazdır.
  • pd.get_dummies() kullanarak type sütununun tek-seçmeli (one-hot) kodlanmış bir kümesini oluştur.
  • Son olarak, pd.concat() ile type_set olarak kodlanan değişkenleri ufo veri kümesine birleştir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____

# Print the number of unique type values
print(len(____.unique()))

# Create a one-hot encoded set of the type values
type_set = ____

# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)
Kodu Düzenle ve Çalıştır