Kategorik değişkenleri kodlama
UFO veri kümesinde, scikit-learn ile modellenecek hale gelmeden önce kodlanması gereken birkaç sütun var. Burada bu dönüşümü, hem ikili (binary) hem de tek-seçmeli (one-hot) kodlama yöntemlerini kullanarak yapacaksın.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
apply()kullanarak, değer"us"ise1, değilse 0 döndüren koşullu birlambdafonksiyonu yaz.typesütunundaki.unique()değerlerinin sayısını yazdır.pd.get_dummies()kullanaraktypesütununun tek-seçmeli (one-hot) kodlanmış bir kümesini oluştur.- Son olarak,
pd.concat()iletype_setolarak kodlanan değişkenleriufoveri kümesine birleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____
# Print the number of unique type values
print(len(____.unique()))
# Create a one-hot encoded set of the type values
type_set = ____
# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)