LoslegenKostenlos loslegen

Verallgemeinerung in Intervalle

K-Anonymität kann ein gutes Datenschutzmodell für bestimmte Datensätze mit wenigen Dimensionen sein. Die beiden wichtigsten Anonymisierungstechniken, um einen Datensatz in eine k-anonyme Tabelle zu transformieren, sind Generalisierung und Unterdrückung.

In dieser Übung transformierst du einen Datensatz mit Zufriedenheitsbewertungen in eine 3-anonyme Tabelle mit potenziell sensiblen Attributen wie satisfaction_rate und work_hours. Einige Kombinationen kommen weniger als dreimal vor. Behebe das, damit das DataFrame 3-anonym ist.

Das DataFrame ist als employees verfügbar. Ein k-Wert von 3 ist ebenfalls verfügbar.

Diese Übung ist Teil des Kurses

Datenschutz und Anonymisierung mit Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Code bearbeiten und ausführen