LoslegenKostenlos loslegen

Einen Datensatz k-anonymisieren

In dieser Übung anonymisierst du den Datensatz NBA Salaries. Denk daran: Um k-Anonymität anzuwenden, musst du Attributtypen angeben. Diese können identifizierend, quasi-identifizierend, sensibel oder unsensibel sein. Wir konzentrieren uns darauf, age und nba_origin als quasi-identifizierend und salary als sensible Daten zu behandeln.

Erkunde nba. Wenn du etwas über eine/n Spieler/in weißt, zum Beispiel dass er/sie aus Spanien kommt und 23 ist, kannst du sensible Informationen wie sein/ihr Gehalt herausfinden! Hier verwenden wir einen K-Wert von 3, sodass die ausgewählten Attribute nicht von mindestens k-1 anderen Zeilen unterscheidbar sind.

Das Hierarchie-Dictionary für nba_Origin wurde bereits als origin_hierarchy erstellt.

Diese Übung ist Teil des Kurses

Datenschutz und Anonymisierung mit Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print how many unique combinations are for age and nba_origin
print(____)
Code bearbeiten und ausführen