Anonymisierung hochdimensionaler Daten
Die Wahrung der Privatsphäre wird durch den Fluch der Dimensionalität ineffizient. Der Fluch der Dimensionalität bezeichnet eine Reihe von Problemen, die beim Arbeiten mit hochdimensionalen Daten auftreten. Mit der Anzahl der Merkmale bzw. Dimensionen wächst die Datenmenge, die wir für eine zuverlässige Generalisierung benötigen, exponentiell. Das gilt besonders für k-Anonymität: Je mehr Spalten, desto komplexer wird es, einen k-anonymen Datensatz zu erreichen.
Wie funktioniert PCA im Hinblick auf die Anonymisierung von Datensätzen und deren Veröffentlichung?
Diese Übung ist Teil des Kurses
<Kurs>Datenschutz und Anonymisierung mit Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten