Generalizzare in intervalli
La k-anonymity è un buon modello di privacy per alcuni insiemi di dati con poche dimensioni. Le due principali tecniche di anonimizzazione usate per trasformare un insieme di dati in una tabella k-anonima sono la generalizzazione e la soppressione.
In questo esercizio trasformerai un insieme di valutazioni di soddisfazione in una tabella 3-anonima contenente possibili attributi sensibili come satisfaction_rate e work_hours. Alcune combinazioni compaiono meno di tre volte. Correggi la situazione per rendere il DataFrame 3-anonimo.
Il DataFrame è disponibile come employees. È disponibile anche un valore di k pari a 3.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)