1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Top a bottom coding platů v Bílém domě

Top a bottom coding nám umožňují skrýt odlehlé hodnoty a snížit riziko identifikace osob, aniž bychom přišli o užitečnost dat.

V tomto cvičení použiješ data o platech z amerického Bílého domu za roky 2019 a 2020. Aplikuj techniku top a bottom codingu na sloupec salary.

Nejdřív si data prozkoumáš a uvidíš, jak se většina hodnot soustředí ve středu rozdělení. Na základě tohoto průzkumu pak zvolíš vhodné hodnoty pro top a bottom coding.

DataFrame je načtený jako wh2020.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vytvoř histogram, který zobrazí rozdělení platů ve sloupci salary. Použij výchozí hodnoty pro počet sloupců.