Generalizando em intervalos
K-anonymity pode ser um bom modelo de privacidade para conjuntos de dados específicos que não têm muitas dimensões. As duas principais técnicas de anonimização usadas para transformar um conjunto de dados em uma tabela k-anônima são generalização e supressão.
Neste exercício, você vai transformar um conjunto de dados de avaliação de satisfação em uma tabela 3-anônima contendo possíveis atributos sensíveis como satisfaction_rate e work_hours. Algumas combinações aparecem menos de três vezes. Corrija isso para tornar o DataFrame 3-anônimo.
O DataFrame está disponível como employees. Um valor de k igual a 3 também está disponível.
Este exercício faz parte do curso
Privacidade de Dados e Anonimização em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)