Verallgemeinerung in Intervalle
K-Anonymität kann ein gutes Datenschutzmodell für bestimmte Datensätze mit wenigen Dimensionen sein. Die beiden wichtigsten Anonymisierungstechniken, um einen Datensatz in eine k-anonyme Tabelle zu transformieren, sind Generalisierung und Unterdrückung.
In dieser Übung transformierst du einen Datensatz mit Zufriedenheitsbewertungen in eine 3-anonyme Tabelle mit potenziell sensiblen Attributen wie satisfaction_rate und work_hours. Einige Kombinationen kommen weniger als dreimal vor. Behebe das, damit das DataFrame 3-anonym ist.
Das DataFrame ist als employees verfügbar. Ein k-Wert von 3 ist ebenfalls verfügbar.
Diese Übung ist Teil des Kurses
Datenschutz und Anonymisierung mit Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)