BaşlayınÜcretsiz Başlayın

Verilerin güvenli yayımlanması için çalışan verilerini hazırlama

Gerçek verilerle çalışırken, müşterilerin ya da diğer kişilerin kişisel bilgilerinin izlenemeyeceğinden veya açığa çıkmayacağından emin olman gerekir. Bu egzersizde, bastırma (suppress) ve genelleme (generalization) tekniklerini pratik etmek için IBM HR Analytics Employee veri kümesinin basitleştirilmiş bir sürümünü kullanacaksın.

Veri kümesi hakkında bilgi sızmasını önlemek için, sütun adlarını sayılarla değiştireceksin.

DataFrame hr olarak yüklendi; keşfetmek için konsolu kullan. numpy, np olarak içe aktarıldı.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Drop unique data and almost unique data
df_dropped = ____(["employee_number", "monthly_income", "monthly_rate", "daily_rate"], axis=1) 

# Drop the rows with NaN values
df_cleaned = ____
Kodu Düzenle ve Çalıştır