Einen Datensatz k-anonymisieren
In dieser Übung anonymisierst du den Datensatz NBA Salaries. Denk daran: Um k-Anonymität anzuwenden, musst du Attributtypen angeben. Diese können identifizierend, quasi-identifizierend, sensibel oder unsensibel sein. Wir konzentrieren uns darauf, age und nba_origin als quasi-identifizierend und salary als sensible Daten zu behandeln.
Erkunde nba. Wenn du etwas über eine/n Spieler/in weißt, zum Beispiel dass er/sie aus Spanien kommt und 23 ist, kannst du sensible Informationen wie sein/ihr Gehalt herausfinden! Hier verwenden wir einen K-Wert von 3, sodass die ausgewählten Attribute nicht von mindestens k-1 anderen Zeilen unterscheidbar sind.
Das Hierarchie-Dictionary für nba_Origin wurde bereits als origin_hierarchy erstellt.
Diese Übung ist Teil des Kurses
Datenschutz und Anonymisierung mit Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print how many unique combinations are for age and nba_origin
print(____)