CommencerCommencer gratuitement

Généraliser en intervalles

Le modèle de k-anonymat convient à certains jeux de données avec peu de dimensions. Les deux principales techniques d’anonymisation pour transformer un jeu de données en table k-anonyme sont la généralisation et la suppression.

Dans cet exercice, vous allez transformer un jeu de données d’évaluation de satisfaction en une table 3-anonyme contenant des attributs potentiellement sensibles comme satisfaction_rate et work_hours. Certaines combinaisons apparaissent moins de trois fois. Corrigez cela pour rendre le DataFrame 3-anonyme.

Le DataFrame est disponible sous le nom employees. Une valeur de k égale à 3 est également fournie.

Cet exercice fait partie du cours

Confidentialité des données et anonymisation en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Modifier et exécuter le code