Masking PII sensitif
Anda diberikan sebuah himpunan data yang berisi Social Security number (SSN) warga Amerika bersama lokasi kota dan usia mereka. Jika data ini belum dirilis dan hanya disetujui untuk dibagikan kepada kami, maka ketika diekspos akan terjadi pelanggaran privasi karena Anda mengungkapkan data yang tidak diharapkan subjek untuk kami bagikan.
Tugas Anda adalah menganonimkan data dengan menerapkan masking parsial pada Sensitive PII ssn. Ingat, masking data bertujuan menyembunyikan/menyamarkan data untuk mencegah pelanggaran privasi data, sambil tetap mempertahankan format dan makna keseluruhan.
Himpunan data telah dimuat sebagai insurance_df, tetapi simpan data hasilnya dalam masked_df agar insurance_df asli tetap utuh.
Latihan ini merupakan bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)