Özellik mühendisliği
Yeni bir kredi başvuru grubunun kredilerini ödeyememe (temerrüt) olasılığını tahmin etmen isteniyor. Elinde geçmişe ait bir veri kümesi var ve bunun üzerinde bir sınıflandırıcı eğitmek istiyorsun. Birçok özelliğin string formatında olduğunu fark ediyorsun; bu da sınıflandırıcıların için sorun oluşturur. Bu nedenle string sütunları sayısal olarak kodlamaya LabelEncoder() ile karar veriyorsun. Bu işlev sklearn içindeki preprocessing alt modülünden senin için önceden yüklendi. credit veri kümesi de yüklü, ayrıca veri tipleri string olan tüm sütun adlarının yer aldığı non_numeric_columns listesi de mevcut.
Bu egzersiz, kursun bir parçasıdır
Python'da Machine Learning İş Akışları Tasarlama
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Inspect the first few lines of your data using head()
credit.____