IniziaInizia gratis

Generalizzare in intervalli

La k-anonymity è un buon modello di privacy per alcuni insiemi di dati con poche dimensioni. Le due principali tecniche di anonimizzazione usate per trasformare un insieme di dati in una tabella k-anonima sono la generalizzazione e la soppressione.

In questo esercizio trasformerai un insieme di valutazioni di soddisfazione in una tabella 3-anonima contenente possibili attributi sensibili come satisfaction_rate e work_hours. Alcune combinazioni compaiono meno di tre volte. Correggi la situazione per rendere il DataFrame 3-anonimo.

Il DataFrame è disponibile come employees. È disponibile anche un valore di k pari a 3.

Questo esercizio fa parte del corso

Riservatezza dei dati e anonimizzazione in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Modifica ed esegui il codice