Aan de slagBegin gratis

Anonimiseren van hoog-dimensionale data

Het behouden van privacy wordt inefficiënt door de vloek van dimensionaliteit. Die vloek verwijst naar een reeks problemen die ontstaan bij het werken met hoog-dimensionale data. Naarmate het aantal features of dimensies toeneemt, groeit de hoeveelheid data die we nodig hebben om goed te kunnen generaliseren exponentieel. Dit geldt vooral voor k-anonimiteit: hoe meer kolommen, hoe complexer het wordt om een k-anonieme gegevensset te bereiken.

Hoe werkt PCA met betrekking tot het anonimiseren van gegevenssets en het vrijgeven van gegevenssets?

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening