Kategorik değişkenleri kodlama - one-hot
volunteer veri kümesindeki sütunlardan biri olan category_desc, listelenen gönüllülük fırsatları için kategori açıklamalarını verir. İkiden fazla kategori içeren bir kategorik değişken olduğu için, bu sütunu sayısal olarak dönüştürmek üzere one-hot kodlama kullanmamız gerekiyor. Bunu yapmak için pandas'ın pd.get_dummies() fonksiyonunu kullan.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
- Kodlanmış sütunları oluşturmak için
volunteer["category_desc"]sütunundaget_dummies()çağır ve sonucucategory_encdeğişkenine ata. - Kodlanmış sütunlara göz atmak için
category_encdeğişkeninin.head()çıktısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)