Kategorik değişkenleri kodlama - one-hot
volunteer veri kümesindeki sütunlardan biri olan category_desc, listelenen gönüllülük fırsatları için kategori açıklamalarını verir. İkiden fazla kategori içeren bir kategorik değişken olduğu için, bu sütunu sayısal olarak dönüştürmek üzere one-hot kodlama kullanmamız gerekiyor. Bunu yapmak için pandas'ın pd.get_dummies() fonksiyonunu kullan.
Bu egzersiz, kursun bir parçasıdır
Python'da Machine Learning için Ön İşleme
Egzersiz talimatları
- Kodlanmış sütunları oluşturmak için
volunteer["category_desc"]sütunundaget_dummies()çağır ve sonucucategory_encdeğişkenine ata. - Kodlanmış sütunlara göz atmak için
category_encdeğişkeninin.head()çıktısını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)