Généraliser en intervalles
Le modèle de k-anonymat convient à certains jeux de données avec peu de dimensions. Les deux principales techniques d’anonymisation pour transformer un jeu de données en table k-anonyme sont la généralisation et la suppression.
Dans cet exercice, vous allez transformer un jeu de données d’évaluation de satisfaction en une table 3-anonyme contenant des attributs potentiellement sensibles comme satisfaction_rate et work_hours. Certaines combinaisons apparaissent moins de trois fois. Corrigez cela pour rendre le DataFrame 3-anonyme.
Le DataFrame est disponible sous le nom employees. Une valeur de k égale à 3 est également fournie.
Cet exercice fait partie du cours
Confidentialité des données et anonymisation en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)