One-hot encoding ve kukla değişkenler
Kategorik değişkenleri bir Machine Learning modelinde kullanabilmek için önce bunları sayısal olarak temsil etmen gerekir. En yaygın iki yaklaşım, değişkenleri one-hot encoding ile dönüştürmek ya da kukla değişkenler (dummy variables) kullanmaktır. Bu egzersizde her iki tür kodlamayı da oluşturacak ve ortaya çıkan sütun kümelerini karşılaştıracaksın. Önceki derste yüklediğimiz ve so_survey_df olarak adlandırılan aynı DataFrame'i kullanmaya devam ediyoruz ve Country sütununa odaklanıyoruz.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)