Sahte değişkenler (dummy variables) oluşturma
Kategorik özellikleri model kurma sürecine dahil edebilmek performansı artırabilir; çünkü tahmin doğruluğuna katkı sağlayan ek bilgiler sunabilirler.
music_df veri kümesi senin için önceden yüklendi ve boyutu yazdırıldı. Ayrıca pandas, pd takma adıyla içe aktarıldı.
Şimdi music_df'nin orijinal sütunlarını artı "genre" sütunundan türetilen sahte değişkenleri içeren yeni bir DataFrame oluşturacaksın.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
- İlk ikili sütunu düşürerek, tüm
music_dfDataFrame'ini geçirip uygun bir fonksiyon kullanarakmusic_dummiesoluştur. music_dummies'ın boyutunu yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))