IniziaInizia gratis

Applicare la k-anonimizzazione a un insieme di dati

In questo esercizio anonimizzerai il dataset NBA Salaries. Ricorda: per applicare la k-anonimity devi specificare i tipi di attributo. Possono essere identificanti, quasi-identificanti, sensibili o non sensibili. Ci concentreremo su age e nba_origin come quasi-identificanti e su salary come dato sensibile.

Esplora nba. Se conosci alcune informazioni su un giocatore, ad esempio che proviene dalla Spagna ed è 23enne, potresti risalire a un dato sensibile come il suo stipendio! Qui useremo un valore di K pari a 3, assicurandoci che gli attributi scelti non possano essere distinti da almeno altre k-1 righe.

Il dizionario di gerarchie per nba_Origin è già stato creato come origin_hierarchy.

Questo esercizio fa parte del corso

Riservatezza dei dati e anonimizzazione in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print how many unique combinations are for age and nba_origin
print(____)
Modifica ed esegui il codice