Namen verwijderen met faker
In deze oefening werk je met de NBA Salaries-gegevensset van 2018. Als deze data niet openbaar zouden zijn, zou er een groot risico zijn op een heridentificatieaanval. Omdat er bijvoorbeeld maar één "Aaron Brooks" in de NBA speelt, zou je zo andere gevoelige info kunnen achterhalen, zoals zijn exacte jaarsalaris. Door persoonlijke namen uit de gegevensset te verwijderen, voorkom je mogelijke schade voor de personen in de data.
De methode .name() genereert willekeurige namen, waaronder ook vrouwelijke namen. Daarnaast ga je ook namen van slechts één gender aanmaken.
De DataFrame is geladen als nba.
Deze oefening maakt deel uit van de cursus
Dataprivacy en anonimisering in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the Faker class
____
# Initialize the generator
____