LoslegenKostenlos starten

Anonymisierung hochdimensionaler Daten

Die Wahrung der Privatsphäre wird durch den Fluch der Dimensionalität ineffizient. Der Fluch der Dimensionalität bezeichnet eine Reihe von Problemen, die beim Arbeiten mit hochdimensionalen Daten auftreten. Mit der Anzahl der Merkmale bzw. Dimensionen wächst die Datenmenge, die wir für eine zuverlässige Generalisierung benötigen, exponentiell. Das gilt besonders für k-Anonymität: Je mehr Spalten, desto komplexer wird es, einen k-anonymen Datensatz zu erreichen.

Wie funktioniert PCA im Hinblick auf die Anonymisierung von Datensätzen und deren Veröffentlichung?

Diese Übung ist Teil des Kurses

<Kurs>Datenschutz und Anonymisierung mit Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten