MulaiMulai sekarang secara gratis

Masking PII sensitif

Anda diberikan sebuah himpunan data yang berisi Social Security number (SSN) warga Amerika bersama lokasi kota dan usia mereka. Jika data ini belum dirilis dan hanya disetujui untuk dibagikan kepada kami, maka ketika diekspos akan terjadi pelanggaran privasi karena Anda mengungkapkan data yang tidak diharapkan subjek untuk kami bagikan.

Tugas Anda adalah menganonimkan data dengan menerapkan masking parsial pada Sensitive PII ssn. Ingat, masking data bertujuan menyembunyikan/menyamarkan data untuk mencegah pelanggaran privasi data, sambil tetap mempertahankan format dan makna keseluruhan.

Himpunan data telah dimuat sebagai insurance_df, tetapi simpan data hasilnya dalam masked_df agar insurance_df asli tetap utuh.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Uniformly mask the SSN numbers with *
____

# See resulting DataFrame
print(____)
Edit dan Jalankan Kode