Mascarando PII sensível
Você recebeu um conjunto de dados com números de Social Security (SSN) de cidadãos americanos, junto com suas cidades e idades. Se esses dados não publicados tivessem sido compartilhados apenas com nosso consentimento e, ainda assim, fossem expostos, haveria uma violação de privacidade, pois você estaria divulgando informações que as pessoas não esperavam que compartilhássemos.
Seu trabalho é anonimizar os dados aplicando mascaramento parcial ao PII sensível ssn. Lembre-se: mascaramento de dados consiste em ocultar/ofuscar dados para evitar violações de privacidade, preservando o formato e o significado gerais.
O conjunto de dados foi carregado como insurance_df, mas salve o resultado em masked_df para manter o insurance_df original intacto.
Este exercicio faz parte do curso
Privacidade de Dados e Anonimização em Python
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)