Verilerin güvenli yayımlanması için çalışan verilerini hazırlama
Gerçek verilerle çalışırken, müşterilerin ya da diğer kişilerin kişisel bilgilerinin izlenemeyeceğinden veya açığa çıkmayacağından emin olman gerekir. Bu egzersizde, bastırma (suppress) ve genelleme (generalization) tekniklerini pratik etmek için IBM HR Analytics Employee veri kümesinin basitleştirilmiş bir sürümünü kullanacaksın.
Veri kümesi hakkında bilgi sızmasını önlemek için, sütun adlarını sayılarla değiştireceksin.
DataFrame hr olarak yüklendi; keşfetmek için konsolu kullan. numpy, np olarak içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile Veri Gizliliği ve Anonimleştirme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Drop unique data and almost unique data
df_dropped = ____(["employee_number", "monthly_income", "monthly_rate", "daily_rate"], axis=1)
# Drop the rows with NaN values
df_cleaned = ____