Masking PII sensitif
Anda diberikan sebuah himpunan data yang berisi Social Security number (SSN) warga Amerika bersama lokasi kota dan usia mereka. Jika data ini belum dirilis dan hanya disetujui untuk dibagikan kepada kami, maka ketika diekspos akan terjadi pelanggaran privasi karena Anda mengungkapkan data yang tidak diharapkan subjek untuk kami bagikan.
Tugas Anda adalah menganonimkan data dengan menerapkan masking parsial pada Sensitive PII ssn. Ingat, masking data bertujuan menyembunyikan/menyamarkan data untuk mencegah pelanggaran privasi data, sambil tetap mempertahankan format dan makna keseluruhan.
Himpunan data telah dimuat sebagai insurance_df, tetapi simpan data hasilnya dalam masked_df agar insurance_df asli tetap utuh.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)