Aplicando k-anonimidade a um conjunto de dados
Neste exercício, você vai anonimizar o conjunto de dados de salários da NBA. Lembre-se: é preciso especificar os tipos de atributos para aplicar k-anonimidade. Eles podem ser identificadores, quase-identificadores, sensíveis ou não sensíveis. Aqui, vamos considerar age e nba_origin como quase-identificadores e salary como dado sensível.
Explore nba. Se você souber informações sobre um(a) jogador(a), como que ele(a) é da Espanha e tem 23 anos, então conseguirá descobrir um dado sensível como o salário dele(a)! Aqui, usaremos um valor de K igual a 3, garantindo que os atributos escolhidos não possam ser distinguidos de pelo menos k-1 outras linhas.
O dicionário de hierarquia para nba_Origin já foi criado como origin_hierarchy.
Este exercício faz parte do curso
Privacidade de Dados e Anonimização em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print how many unique combinations are for age and nba_origin
print(____)