Generaliseren naar bereiken
K-anonymity kan een goed privacymodel zijn voor specifieke gegevenssets met niet al te veel dimensies. De twee belangrijkste anonimiseringstechnieken om een gegevensset om te zetten naar een k-anonieme tabel zijn generalisatie en suppressie.
In deze oefening zet je een gegevensset met tevredenheidscores om naar een 3-anonieme tabel met mogelijke gevoelige kenmerken zoals satisfaction_rate en work_hours. Sommige combinaties komen minder dan drie keer voor. Los dat op zodat de DataFrame 3-anoniem is.
De DataFrame is beschikbaar als employees. Een k-waarde van 3 is ook beschikbaar.
Deze oefening maakt deel uit van de cursus
Dataprivacy en anonimisering in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)