1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Generalizace do rozsahů

K-anonymita může být vhodným modelem ochrany soukromí pro datové sady, které nemají příliš mnoho dimenzí. Dvě hlavní anonymizační techniky používané k převodu datové sady na k-anonymní tabulku jsou generalizace a potlačení.

V tomto cvičení převedeš datovou sadu hodnocení spokojenosti na 3-anonymní tabulku obsahující potenciálně citlivé atributy jako satisfaction_rate a work_hours. Některé kombinace se vyskytují méně než třikrát. Oprav to tak, aby byl DataFrame 3-anonymní.

DataFrame je dostupný jako employees. K dispozici je také hodnota k rovná 3.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Zjisti, kolik jedinečných kombinací existuje pro birth_year a department.
  • Použij .reset_index() a nově vzniklý sloupec s počty pojmenuj count — název předej jako argument parametru name.