1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Explorarea datelor cu un contabil al bugetului de confidențialitate

Sistemele de explorare a datelor care oferă confidențialitate diferențială trebuie să gestioneze un buget de confidențialitate ce măsoară cantitatea de confidențialitate pierdută în urma mai multor interogări.

În acest exercițiu, vei explora setul de date IBM HR Analytics Employee Attrition & Performance urmărind în același timp bugetul de confidențialitate. Reține că, dacă o interogare depășește bugetul specificat în contabil, apare o eroare.

Histograma este un instrument util pentru a vizualiza datele într-un mod compatibil cu confidențialitatea diferențială. Sintaxa este aceeași ca pentru funcția corespunzătoare din numpy, cu un parametru epsilon.

Setul complet de date este disponibil ca hr, iar atributul de vârstă al angajaților ca ages. O funcție personalizată a fost creată și încărcată ca show_histogram() pentru a reprezenta grafic histograma, la fel cum ai făcut anterior în curs.

Instrucțiuni

100 XP
  • Creează un BudgetAccountant de confidențialitate cu un epsilon de 1.5, folosind constructorul acestuia.
  • Generează un histogram privat din coloana ages cu o valoare epsilon de 0.1.
  • Calculează și afișează media privată a coloanei ages, folosind un epsilon de 0.9 și limite de la 10 la 100 sub formă de tuplu.
  • Afișează bugetul de confidențialitate rămas pentru următoarele două interogări noi.