Maskierung sensibler PII
Du hast einen Datensatz mit Social-Security-Nummern (SSN) von US-Bürger:innen erhalten, zusammen mit deren Städten und Alter. Wenn diese Daten noch unveröffentlicht sind und nur zur Nutzung durch uns freigegeben wurden, würde ihre Weitergabe einen Datenschutzverstoß darstellen, da du Informationen offenlegst, deren Weitergabe die Betroffenen nicht erwartet haben.
Deine Aufgabe ist es, die Daten zu anonymisieren, indem du eine partielle Maskierung auf die sensible PII ssn anwendest. Denk daran: Datenmaskierung bedeutet, Daten zu verbergen bzw. zu verfremden, um Datenschutzverletzungen zu vermeiden – bei gleichzeitigem Erhalt des Formats und der Bedeutung.
Der Datensatz wurde als insurance_df geladen. Speichere das Ergebnis jedoch in masked_df, damit insurance_df unverändert bleibt.
Diese Übung ist Teil des Kurses
Datenschutz und Anonymisierung mit Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Uniformly mask the SSN numbers with *
____
# See resulting DataFrame
print(____)