Aan de slagGa gratis aan de slag

Generaliseren naar bereiken

K-anonymity kan een goed privacymodel zijn voor specifieke gegevenssets met niet al te veel dimensies. De twee belangrijkste anonimiseringstechnieken om een gegevensset om te zetten naar een k-anonieme tabel zijn generalisatie en suppressie.

In deze oefening zet je een gegevensset met tevredenheidscores om naar een 3-anonieme tabel met mogelijke gevoelige kenmerken zoals satisfaction_rate en work_hours. Sommige combinaties komen minder dan drie keer voor. Los dat op zodat de DataFrame 3-anoniem is.

De DataFrame is beschikbaar als employees. Een k-waarde van 3 is ook beschikbaar.

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Code bewerken en uitvoeren