Anonymisation de données à haute dimension
Préserver la confidentialité devient inefficace à cause de la malédiction de la dimensionnalité. Cette malédiction désigne un ensemble de problèmes qui surviennent lorsqu’on travaille avec des données à haute dimension. À mesure que le nombre de variables ou de dimensions augmente, la quantité de données nécessaire pour bien généraliser croît de façon exponentielle. C’est particulièrement vrai avec la k-anonymat : plus il y a de colonnes, plus il est complexe d’obtenir un jeu de données k-anonyme.
Comment l’ACP fonctionne-t-elle pour l’anonymisation des jeux de données et leur diffusion ?
Cet exercice fait partie du cours
Confidentialité des données et anonymisation en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice