Çok kategorili bir değişkenden kukla değişkenler oluşturma
Elinde, tek bir yordayıcı değişkeni "country" olan bir basetable var. Lojistik regresyon modelinde kullanılabilmesi için "country" değişkeni için kukla değişkenler oluşturarak bu değişkeni modellemeye hazır hale getir.
Bu egzersiz, kursun bir parçasıdır
Python ile Orta Düzey Öngörüsel Analitik
Egzersiz talimatları
- "country" için kukla değişkenleri içeren bir pandas dataframe'i
dummies_countryoluştur. Çoklu doğrusal bağlantıdan kaçındığından emin ol. - Bu kuklaları orijinal
basetable'a ekle. - Orijinal "country" değişkenini
basetable'dan kaldır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())