Hassas PII’yi maskeleme
Amerikan vatandaşlarının Sosyal Güvenlik numaralarını (SSN), şehir konumlarını ve yaşlarını içeren bir veri kümesi sana verildi. Bu veri yalnızca bizimle paylaşılmasına onay verilmiş ve henüz kamuya açıklanmamış olsaydı, bunu ifşa etmek, ilgili kişilerin beklemediği verileri paylaşmış olacağın için bir mahremiyet ihlaline yol açardı.
Görevin, hassas PII olan ssn üzerinde kısmi maskeleme uygulayarak veriyi anonimleştirmek. Unutma, veri maskeleme; genel biçim ve anlamı korurken, veri gizliliği ihlallerini önlemek için veriyi gizleme/saptırma işlemidir.
Veri kümesi insurance_df olarak yüklendi, ancak orijinal insurance_df bozulmasın diye ortaya çıkan veriyi masked_df içinde sakla.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)