1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Eliminarea numelor cu faker

În acest exercițiu, vei lucra cu setul de date NBA Salaries din 2018. Dacă aceste date nu ar fi publice, ar exista un risc ridicat de atac de re-identificare. De exemplu, deoarece există un singur „Aaron Brooks" care joacă în NBA, ar fi posibil să se afle și alte informații sensibile, cum ar fi salariul său exact pe an. Eliminând numele personale din setul de date, poți preveni potențiale prejudicii aduse persoanelor din acesta.

Metoda .name() generează nume aleatorii, inclusiv unele feminine. Pe lângă aceasta, vei crea și nume de un singur gen.

DataFrame-ul a fost încărcat ca nba.

Instrucțiuni 1/3

undefined XP
  • 1
    • Importă clasa Faker.
    • Inițializează generatorul faker ca fake_data.
  • 2
    • Schimbă numele jucătorilor NBA folosind metoda .name() din faker, cu o funcție lambda aplicată pe coloana player.
  • 3
    • Generează doar nume masculine.