Mascarando PII sensível
Você recebeu um conjunto de dados com números de Social Security (SSN) de cidadãos americanos, junto com suas cidades e idades. Se esses dados não publicados tivessem sido compartilhados apenas com nosso consentimento e, ainda assim, fossem expostos, haveria uma violação de privacidade, pois você estaria divulgando informações que as pessoas não esperavam que compartilhássemos.
Seu trabalho é anonimizar os dados aplicando mascaramento parcial ao PII sensível ssn. Lembre-se: mascaramento de dados consiste em ocultar/ofuscar dados para evitar violações de privacidade, preservando o formato e o significado gerais.
O conjunto de dados foi carregado como insurance_df, mas salve o resultado em masked_df para manter o insurance_df original intacto.
Este exercício faz parte do curso
Privacidade de Dados e Anonimização em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)