Generalización en intervalos
K-anonymity puede ser un buen modelo de privacidad para conjuntos de datos específicos que no tienen muchas dimensiones. Las dos técnicas principales de anonimización usadas para transformar un conjunto de datos en una tabla k-anónima son la generalización y la supresión.
En este ejercicio, vas a transformar un conjunto de datos de puntuaciones de satisfacción en una tabla 3-anónima que contiene posibles atributos sensibles como satisfaction_rate y work_hours. Algunas combinaciones aparecen menos de tres veces. Corrige eso para que el DataFrame sea 3-anónimo.
El DataFrame está disponible como employees. También está disponible un valor de k igual a 3.
Este ejercicio forma parte del curso
Privacidad de datos y anonimización en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)