Mascherare PII sensibili
Ti è stato fornito un insieme di dati con i numeri di Social Security (SSN) di cittadini americani, insieme alla città e all’età. Se questi dati non fossero stati pubblicati e fosse stato dato il consenso a condividerli solo con noi, esporli causerebbe una violazione della privacy, perché stai divulgando informazioni che gli interessati non si aspettavano venissero condivise.
Il tuo compito è anonimizzare i dati applicando una mascheratura parziale alla PII sensibile ssn. Ricorda: la mascheratura dei dati serve a nascondere/offuscare i dati per evitare violazioni della privacy, mantenendo però il formato e la semantica complessivi.
Il dataset è stato caricato come insurance_df, ma salva i dati risultanti in masked_df per lasciare intatto l’insurance_df originale.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)