Anonymisierung hochdimensionaler Daten
Die Wahrung der Privatsphäre wird durch den Fluch der Dimensionalität ineffizient. Der Fluch der Dimensionalität bezeichnet eine Reihe von Problemen, die beim Arbeiten mit hochdimensionalen Daten auftreten. Mit der Anzahl der Merkmale bzw. Dimensionen wächst die Datenmenge, die wir für eine zuverlässige Generalisierung benötigen, exponentiell. Das gilt besonders für k-Anonymität: Je mehr Spalten, desto komplexer wird es, einen k-anonymen Datensatz zu erreichen.
Wie funktioniert PCA im Hinblick auf die Anonymisierung von Datensätzen und deren Veröffentlichung?
Diese Übung ist Teil des Kurses
Datenschutz und Anonymisierung mit Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten