1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Průzkum dat s účetní knihou ochrany soukromí

Systémy pro průzkum dat, které zajišťují diferenciální soukromí, musí spravovat rozpočet ochrany soukromí – ten měří, kolik soukromí se ztratí při více dotazech.

V tomto cvičení prozkoumáš datovou sadu IBM HR Analytics Employee Attrition & Performance a přitom budeš sledovat rozpočet ochrany soukromí. Nezapomeň, že pokud dotaz překročí rozpočet nastavený v účetní knize, vznikne chyba.

Histogram je užitečný nástroj pro vizualizaci dat způsobem, který zachovává diferenciální soukromí. Syntaxe je stejná jako u odpovídající funkce v numpy, přičemž přibývá parametr epsilon.

Celá datová sada je dostupná jako hr a atribut věku zaměstnanců jako ages. Vlastní funkce byla vytvořena a načtena jako show_histogram() pro vykreslení histogramu, jak jsi to dělal/a dříve v kurzu.

Pokyny

100 XP
  • Vytvoř BudgetAccountant pro ochranu soukromí s hodnotou epsilon rovnou 1.5 pomocí příslušného konstruktoru.
  • Vygeneruj soukromý histogram ze sloupce ages s hodnotou epsilon rovnou 0.1.
  • Získej a zobraz soukromý průměr ages s hodnotou epsilon rovnou 0.9 a mezemi od 10 do 100 jako n-tici.
  • Vypiš zbývající rozpočet ochrany soukromí pro dva nové následující dotazy.