Applicare la k-anonimizzazione a un insieme di dati
In questo esercizio anonimizzerai il dataset NBA Salaries. Ricorda: per applicare la k-anonimity devi specificare i tipi di attributo. Possono essere identificanti, quasi-identificanti, sensibili o non sensibili. Ci concentreremo su age e nba_origin come quasi-identificanti e su salary come dato sensibile.
Esplora nba. Se conosci alcune informazioni su un giocatore, ad esempio che proviene dalla Spagna ed è 23enne, potresti risalire a un dato sensibile come il suo stipendio! Qui useremo un valore di K pari a 3, assicurandoci che gli attributi scelti non possano essere distinti da almeno altre k-1 righe.
Il dizionario di gerarchie per nba_Origin è già stato creato come origin_hierarchy.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print how many unique combinations are for age and nba_origin
print(____)