CommencerCommencez gratuitement

Généraliser en intervalles

Le modèle de k-anonymat convient à certains jeux de données avec peu de dimensions. Les deux principales techniques d’anonymisation pour transformer un jeu de données en table k-anonyme sont la généralisation et la suppression.

Dans cet exercice, vous allez transformer un jeu de données d’évaluation de satisfaction en une table 3-anonyme contenant des attributs potentiellement sensibles comme satisfaction_rate et work_hours. Certaines combinaisons apparaissent moins de trois fois. Corrigez cela pour rendre le DataFrame 3-anonyme.

Le DataFrame est disponible sous le nom employees. Une valeur de k égale à 3 est également fournie.

Cet exercice fait partie du cours

<cours>Confidentialité des données et anonymisation en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Modifier et exécuter le code