Sayısal ve kategorik sütunları ayır
Son egzersizde veri kümesinin özelliklerini inceledin ve şimdi bazı veri ön işleme adımlarına hazırsın. Bu aşamada telco_raw DataFrame’indeki kategorik ve sayısal değişkenleri, kategorik–sayısal ayrımı için özelleştirilmiş bir benzersiz değer sayısı eşik değeri kullanarak ayıracaksın. pandas modülü senin için pd takma adıyla yüklendi.
Ham telekom müşteri kaybı veri kümesi telco_raw, pandas DataFrame’i olarak yüklendi. Konsolda keşfederek veri kümesine aşina olabilirsin.
Bu egzersiz
Python ile Pazarlama için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
customerIDveChurnsütun adlarını sakla.- Benzersiz değeri 5’ten az olan sütun adlarını
categoricaldeğişkenine ata. targetöğesini listeden çıkar.numericaliçin,custid,targetvecategoricaliçinde olmayan tüm sütun adlarını ata.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Store customerID and Churn column names
custid = ['___']
target = ['___']
# Store categorical column names
categorical = telco_raw.___()[telco_raw.nunique() < ___].keys().tolist()
# Remove target from the list of categorical variables
categorical.remove(___[0])
# Store numerical column names
numerical = [x for x in telco_raw.___ if x not in custid + ___ + categorical]