1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Generalizare în intervale

K-anonimitatea poate fi un model de confidențialitate potrivit pentru seturi de date cu puține dimensiuni. Cele două tehnici principale de anonimizare folosite pentru a transforma un set de date într-un tabel k-anonim sunt generalizarea și suprimarea.

În acest exercițiu, vei transforma un set de date cu evaluări ale satisfacției într-un tabel 3-anonim, care conține atribute potențial sensibile precum satisfaction_rate și work_hours. Unele combinații apar de mai puțin de trei ori. Remediază această problemă pentru a face din DataFrame un tabel 3-anonim.

DataFrame-ul este disponibil sub numele employees. Valoarea k este 3 și este deja disponibilă.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Calculează câte combinații unice există pentru birth_year și department.
  • Folosește .reset_index() și denumește noua coloană generată, care va stoca numărul de apariții, count, transmițând-o ca argument pentru parametrul name.