Verilerin güvenli yayımlanması için çalışan verilerini hazırlama
Gerçek verilerle çalışırken, müşterilerin ya da diğer kişilerin kişisel bilgilerinin izlenemeyeceğinden veya açığa çıkmayacağından emin olman gerekir. Bu egzersizde, bastırma (suppress) ve genelleme (generalization) tekniklerini pratik etmek için IBM HR Analytics Employee veri kümesinin basitleştirilmiş bir sürümünü kullanacaksın.
Veri kümesi hakkında bilgi sızmasını önlemek için, sütun adlarını sayılarla değiştireceksin.
DataFrame hr olarak yüklendi; keşfetmek için konsolu kullan. numpy, np olarak içe aktarıldı.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Drop unique data and almost unique data
df_dropped = ____(["employee_number", "monthly_income", "monthly_rate", "daily_rate"], axis=1)
# Drop the rows with NaN values
df_cleaned = ____