Aan de slagGa gratis aan de slag

Maskeren van gevoelige PII

Je hebt een gegevensset gekregen met Social Security-nummers (SSN) van Amerikaanse burgers, samen met hun woonplaats en leeftijd. Als deze ongepubliceerde gegevens alleen met toestemming met ons gedeeld mochten worden, zou het delen ervan een privacyschending opleveren, omdat je informatie openbaar maakt die de betrokkenen niet van ons verwachtten te delen.

Jouw taak is om de gegevens te anonimiseren door gedeeltelijke masking toe te passen op de gevoelige PII ssn. Onthoud: datamasking draait om het verbergen/obfusceren van gegevens om privacyschendingen te voorkomen, terwijl je het algemene formaat en de betekenis bewaart.

De gegevensset is geladen als insurance_df, maar sla de resulterende gegevens op in masked_df om het oorspronkelijke insurance_df intact te houden.

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Uniformly mask the SSN numbers with *
____

# See resulting DataFrame
print(____)
Code bewerken en uitvoeren