BaşlayınÜcretsiz başlayın

Verilerin güvenli yayımlanması için çalışan verilerini hazırlama

Gerçek verilerle çalışırken, müşterilerin ya da diğer kişilerin kişisel bilgilerinin izlenemeyeceğinden veya açığa çıkmayacağından emin olman gerekir. Bu egzersizde, bastırma (suppress) ve genelleme (generalization) tekniklerini pratik etmek için IBM HR Analytics Employee veri kümesinin basitleştirilmiş bir sürümünü kullanacaksın.

Veri kümesi hakkında bilgi sızmasını önlemek için, sütun adlarını sayılarla değiştireceksin.

DataFrame hr olarak yüklendi; keşfetmek için konsolu kullan. numpy, np olarak içe aktarıldı.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Drop unique data and almost unique data
df_dropped = ____(["employee_number", "monthly_income", "monthly_rate", "daily_rate"], axis=1) 

# Drop the rows with NaN values
df_cleaned = ____
Kodu Düzenle ve Çalıştır