1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ochrana soukromí a anonymizace dat v Pythonu

Connected

cvičení

Odstraňování jmen pomocí Fakeru

V tomto cvičení budeš pracovat s datasetem NBA Salaries z roku 2018. Kdyby tato data nebyla veřejná, hrozilo by velké riziko útoku na re-identifikaci. Například protože v NBA hraje jediný „Aaron Brooks", bylo by možné zjistit další citlivé informace, třeba jeho přesný roční plat. Odstraněním osobních jmen z datasetu můžeš předejít potenciálnímu poškození lidí, jejichž data jsou v něm obsažena.

Metoda .name() generuje náhodná jména, včetně ženských. Kromě toho také vytvoříš jména pouze jednoho pohlaví.

DataFrame je načten jako nba.

Instrukce 1/3

undefined XP
  • 1
    • Importuj třídu Faker.
    • Inicializuj generátor Fakeru jako fake_data.
  • 2
    • Změň jména hráčů NBA pomocí metody .name() z knihovny faker a funkce lambda aplikované na sloupec player.
  • 3
    • Generuj pouze mužská jména.