BaşlayınÜcretsiz Başlayın

Sayısal ve kategorik sütunları ayır

Son egzersizde veri kümesinin özelliklerini inceledin ve şimdi bazı veri ön işleme adımlarına hazırsın. Bu aşamada telco_raw DataFrame’indeki kategorik ve sayısal değişkenleri, kategorik–sayısal ayrımı için özelleştirilmiş bir benzersiz değer sayısı eşik değeri kullanarak ayıracaksın. pandas modülü senin için pd takma adıyla yüklendi.

Ham telekom müşteri kaybı veri kümesi telco_raw, pandas DataFrame’i olarak yüklendi. Konsolda keşfederek veri kümesine aşina olabilirsin.

Bu egzersiz

Python ile Pazarlama için Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • customerID ve Churn sütun adlarını sakla.
  • Benzersiz değeri 5’ten az olan sütun adlarını categorical değişkenine ata.
  • target öğesini listeden çıkar.
  • numerical için, custid, target ve categorical içinde olmayan tüm sütun adlarını ata.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Store customerID and Churn column names
custid = ['___']
target = ['___']

# Store categorical column names
categorical = telco_raw.___()[telco_raw.nunique() < ___].keys().tolist()

# Remove target from the list of categorical variables
categorical.remove(___[0])

# Store numerical column names
numerical = [x for x in telco_raw.___ if x not in custid + ___ + categorical]
Kodu Düzenle ve Çalıştır