Aan de slagGa gratis aan de slag

Anonimiseren van hoog-dimensionale data

Het behouden van privacy wordt inefficiënt door de vloek van dimensionaliteit. Die vloek verwijst naar een reeks problemen die ontstaan bij het werken met hoog-dimensionale data. Naarmate het aantal features of dimensies toeneemt, groeit de hoeveelheid data die we nodig hebben om goed te kunnen generaliseren exponentieel. Dit geldt vooral voor k-anonimiteit: hoe meer kolommen, hoe complexer het wordt om een k-anonieme gegevensset te bereiken.

Hoe werkt PCA met betrekking tot het anonimiseren van gegevenssets en het vrijgeven van gegevenssets?

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen