1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Příprava dat o zaměstnancích pro bezpečné zveřejnění

Při práci s reálnými daty je potřeba zajistit, aby osobní informace zákazníků ani jiných osob nebylo možné dohledat ani odhalit. V tomto cvičení použiješ zjednodušenou verzi datasetu IBM HR Analytics Employee a procvičíš techniky potlačení a generalizace dat.

Aby nedošlo k úniku informací o datasetu, nahradíš názvy sloupců čísly.

DataFrame je načten jako hr, prozkoumej ho v konzoli. numpy je importován jako np.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Odstraň z hr řádky s unikátními hodnotami.
  • Získej df_cleaned odstraněním hodnot NaN z df_dropped.