CommencerCommencer gratuitement

Masquage des PII sensibles

On vous a fourni un jeu de données contenant des numéros de sécurité sociale (SSN) de citoyens américains, ainsi que leur ville et leur âge. Si ces données, non publiées, n’étaient consenties qu’à être partagées avec nous, les exposer entraînerait une violation de la vie privée, car vous divulguez des informations que les personnes concernées ne s’attendaient pas à voir partagées.

Votre mission est d’anonymiser les données en appliquant un masquage partiel sur la PII sensible ssn. Rappelez-vous : le masquage de données consiste à cacher/obfusquer des informations pour éviter des violations de confidentialité, tout en préservant le format et la sémantique globaux.

Le jeu de données a été chargé sous le nom insurance_df, mais enregistrez le résultat dans masked_df afin de conserver insurance_df inchangé.

Cet exercice fait partie du cours

Confidentialité des données et anonymisation en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Uniformly mask the SSN numbers with *
____

# See resulting DataFrame
print(____)
Modifier et exécuter le code