BaşlayınÜcretsiz başlayın

Sayısal ve kategorik sütunları ayır

Son egzersizde veri kümesinin özelliklerini inceledin ve şimdi bazı veri ön işleme adımlarına hazırsın. Bu aşamada telco_raw DataFrame’indeki kategorik ve sayısal değişkenleri, kategorik–sayısal ayrımı için özelleştirilmiş bir benzersiz değer sayısı eşik değeri kullanarak ayıracaksın. pandas modülü senin için pd takma adıyla yüklendi.

Ham telekom müşteri kaybı veri kümesi telco_raw, pandas DataFrame’i olarak yüklendi. Konsolda keşfederek veri kümesine aşina olabilirsin.

Bu egzersiz, kursun bir parçasıdır

Python ile Pazarlama için Machine Learning

Kursa Göz Atın

Egzersiz talimatları

  • customerID ve Churn sütun adlarını sakla.
  • Benzersiz değeri 5’ten az olan sütun adlarını categorical değişkenine ata.
  • target öğesini listeden çıkar.
  • numerical için, custid, target ve categorical içinde olmayan tüm sütun adlarını ata.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Store customerID and Churn column names
custid = ['___']
target = ['___']

# Store categorical column names
categorical = telco_raw.___()[telco_raw.nunique() < ___].keys().tolist()

# Remove target from the list of categorical variables
categorical.remove(___[0])

# Store numerical column names
numerical = [x for x in telco_raw.___ if x not in custid + ___ + categorical]
Kodu Düzenle ve Çalıştır