Rimozione dei nomi con faker
In questo esercizio lavorerai con il dataset degli stipendi NBA 2018. Se questi dati non fossero pubblici, ci sarebbe un alto rischio di attacco di re-identificazione. Per esempio, dato che c’è un solo "Aaron Brooks" che gioca in NBA, sarebbe possibile risalire ad altre informazioni sensibili come il suo stipendio annuo esatto. Rimuovendo i nomi personali dal dataset, puoi evitare potenziali danni alle persone coinvolte.
Il metodo .name() genererà nomi casuali, inclusi alcuni femminili. Oltre a questo, creerai anche nomi di un solo genere.
Il DataFrame è stato caricato come nba.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the Faker class
____
# Initialize the generator
____