1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Aplicarea k-anonimității unui set de date

În acest exercițiu, vei anonimiza setul de date NBA Salaries. Reține că trebuie să specifici tipurile de atribute pentru a aplica k-anonimitatea. Acestea pot fi identificatoare, quasi-identificatoare, sensibile sau insensibile. Ne vom concentra pe age și nba_origin ca atribute quasi-identificatoare și pe salary ca date sensibile.

Explorează nba. Dacă știi informații despre un jucător – de exemplu, că este din Spania și are 23 de ani – poți afla date sensibile, cum ar fi salariul acestuia! Vom folosi o valoare K egală cu 3, asigurând astfel că atributele alese nu pot fi distinse față de cel puțin k-1 alte rânduri.

Dicționarul de ierarhii pentru nba_Origin este deja creat sub numele origin_hierarchy.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Afișează câte combinații unice de age și nba_origin există în set de date, grupând după aceste valori, și numește noua coloană count.