IniziaInizia gratis

Mascherare PII sensibili

Ti è stato fornito un insieme di dati con i numeri di Social Security (SSN) di cittadini americani, insieme alla città e all’età. Se questi dati non fossero stati pubblicati e fosse stato dato il consenso a condividerli solo con noi, esporli causerebbe una violazione della privacy, perché stai divulgando informazioni che gli interessati non si aspettavano venissero condivise.

Il tuo compito è anonimizzare i dati applicando una mascheratura parziale alla PII sensibile ssn. Ricorda: la mascheratura dei dati serve a nascondere/offuscare i dati per evitare violazioni della privacy, mantenendo però il formato e la semantica complessivi.

Il dataset è stato caricato come insurance_df, ma salva i dati risultanti in masked_df per lasciare intatto l’insurance_df originale.

Questo esercizio fa parte del corso

Riservatezza dei dati e anonimizzazione in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Uniformly mask the SSN numbers with *
____

# See resulting DataFrame
print(____)
Modifica ed esegui il codice