ComeçarComece de graça

Aplicando k-anonimidade a um conjunto de dados

Neste exercício, você vai anonimizar o conjunto de dados de salários da NBA. Lembre-se: é preciso especificar os tipos de atributos para aplicar k-anonimidade. Eles podem ser identificadores, quase-identificadores, sensíveis ou não sensíveis. Aqui, vamos considerar age e nba_origin como quase-identificadores e salary como dado sensível.

Explore nba. Se você souber informações sobre um(a) jogador(a), como que ele(a) é da Espanha e tem 23 anos, então conseguirá descobrir um dado sensível como o salário dele(a)! Aqui, usaremos um valor de K igual a 3, garantindo que os atributos escolhidos não possam ser distinguidos de pelo menos k-1 outras linhas.

O dicionário de hierarquia para nba_Origin já foi criado como origin_hierarchy.

Este exercício faz parte do curso

Privacidade de Dados e Anonimização em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print how many unique combinations are for age and nba_origin
print(____)
Editar e executar o código