Enmascarar PII sensible
Te han dado un conjunto de datos con números de la Seguridad Social (SSN) de ciudadanos estadounidenses junto con su ciudad y edad. Si estos datos no se hubieran publicado y solo se hubiera dado consentimiento para compartirlos con nosotros, al exponerlos se produciría una violación de privacidad, ya que estarías revelando datos que las personas no esperaban que compartiéramos.
Tu tarea es anonimizar los datos aplicando un enmascaramiento parcial a la PII sensible ssn. Recuerda: el enmascaramiento de datos consiste en ocultar/obfuscar datos para evitar vulneraciones de privacidad, manteniendo el formato y la semántica generales.
El conjunto de datos se ha cargado como insurance_df, pero guarda el resultado en masked_df para mantener intacto el insurance_df original.
Este ejercicio forma parte del curso
Privacidad de datos y anonimización en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)