One-hot encoding ve kukla değişkenler
Kategorik değişkenleri bir Machine Learning modelinde kullanabilmek için önce bunları sayısal olarak temsil etmen gerekir. En yaygın iki yaklaşım, değişkenleri one-hot encoding ile dönüştürmek ya da kukla değişkenler (dummy variables) kullanmaktır. Bu egzersizde her iki tür kodlamayı da oluşturacak ve ortaya çıkan sütun kümelerini karşılaştıracaksın. Önceki derste yüklediğimiz ve so_survey_df olarak adlandırılan aynı DataFrame'i kullanmaya devam ediyoruz ve Country sütununa odaklanıyoruz.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)