LoslegenKostenlos loslegen

Maskierung sensibler PII

Du hast einen Datensatz mit Social-Security-Nummern (SSN) von US-Bürger:innen erhalten, zusammen mit deren Städten und Alter. Wenn diese Daten noch unveröffentlicht sind und nur zur Nutzung durch uns freigegeben wurden, würde ihre Weitergabe einen Datenschutzverstoß darstellen, da du Informationen offenlegst, deren Weitergabe die Betroffenen nicht erwartet haben.

Deine Aufgabe ist es, die Daten zu anonymisieren, indem du eine partielle Maskierung auf die sensible PII ssn anwendest. Denk daran: Datenmaskierung bedeutet, Daten zu verbergen bzw. zu verfremden, um Datenschutzverletzungen zu vermeiden – bei gleichzeitigem Erhalt des Formats und der Bedeutung.

Der Datensatz wurde als insurance_df geladen. Speichere das Ergebnis jedoch in masked_df, damit insurance_df unverändert bleibt.

Diese Übung ist Teil des Kurses

Datenschutz und Anonymisierung mit Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Uniformly mask the SSN numbers with *
____

# See resulting DataFrame
print(____)
Code bearbeiten und ausführen