BaşlayınÜcretsiz başlayın

Genelleştirme ile kimlik tespit riskini azaltma

Bu egzersizde, IBM HR Analytics Employee Attrition & Performance veri kümesi üzerinde genelleştirme uygulayacaksın.

Daha özel olarak, monthly_income değişkenini ikili (binary) bir sütuna dönüştüreceksin. Dönüşüm için kullanılacak eşik değeri, maaşların ortalamasının yukarı yuvarlanmış hali olacak. Yeni değerler, tam sayı ortalamadan küçük veya ona eşit olanlar için 0, daha büyük olanlar için 1 olacak.

Veri kümesi pandas DataFrame'i hr olarak yüklendi.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Egzersiz talimatları

  • .mean() kullanarak monthly_income sütununun ortalamasını hesapla ve tam sayıya yuvarla. mean_income olarak kaydet.
  • Gelirleri genelleştirmek için hr['monthly_income'] üzerine bir lambda fonksiyonu uygula: değeri mean_income'dan küçük veya eşitse 0, büyükse 1 yap.
  • Ortaya çıkan hr DataFrame'inin ilk beş satırını incele.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Calculate the mean value of incomes
mean_income = ____

# Apply generalization by transforming to binary data
hr['monthly_income'] = ____

# See resulting DataFrame
print(____)
Kodu Düzenle ve Çalıştır