1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Usuwanie imion i nazwisk za pomocą faker

W tym ćwiczeniu będziesz pracować z zestawem danych o wynagrodzeniach graczy NBA z 2018 roku. Gdyby te dane nie były publiczne, istniałoby wysokie ryzyko ataku re-identyfikacji. Na przykład – skoro w NBA gra tylko jeden „Aaron Brooks", można by na podstawie jego nazwiska odkryć inne wrażliwe informacje, takie jak jego dokładne roczne wynagrodzenie. Usuwając imiona i nazwiska z zestawu danych, chronisz prywatność osób w nim zawartych.

Metoda .name() generuje losowe imiona i nazwiska, w tym żeńskie. W kolejnych krokach ograniczysz generowanie nazw do jednej płci.

Dane zostały wczytane do zmiennej nba.

Instrukcje 1/3

undefined XP
  • 1
    • Zaimportuj klasę Faker.
    • Zainicjalizuj generator faker jako fake_data.
  • 2
    • Zastąp imiona i nazwiska graczy NBA, używając metody .name() biblioteki faker z funkcją lambda zastosowaną do kolumny player.
  • 3
    • Generuj wyłącznie męskie imiona i nazwiska.