BaşlayınÜcretsiz başlayın

Kategorik veriler için hiyerarşileri kullanma

Bu egzersizde, US Adult Income veri kümesinin bachelors sütununda veri genellemesi uygulamak için hiyerarşiler oluşturup kullanacaksın.

Hiyerarşileri içeren bir başlangıç sözlüğü hierarchies olarak hazır. Eğitim türleri için üç kategori tutar: Primary, Secondary ve Higher; her birinde verideki karşılık gelen eğitim değerlerinin listesi bulunur. İnteraktif konsolda keşfetmekten çekinme.

Genelleştirilmiş eğitim bilgisini tutacak ve orijinal değerleri bununla değiştireceğimiz yeni bir sözlük oluşturacağız.

Veri kümesi income_df olarak mevcut.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Egzersiz talimatları

  • education_hierarchy sözlüğünü boş bir sözlük olarak başlat.
  • İç döngüyü tamamlayarak eğitim türü key değerini ata. Örneğin {'Some-college': 'Higher education'}.
  • Eğitim hiyerarşisi genellemesini bachelors sütununa uygula ve sonucu yeni bachelors_generalized sütununa ata.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Initialize dictionary for each education category value
education_hierarchy = ____

# Create hierachy for each of the education category values
for (key,education_values) in hierarchies.items():
    for education in education_values:
        education_hierarchy[education] = ____

# Apply education_hierarchy generalization to bachelors
income_df['bachelors_generalized'] = ____

# See resulting dataset
print(income_df.head())
Kodu Düzenle ve Çalıştır