Supprimer les noms avec faker
Dans cet exercice, vous allez travailler avec le jeu de données des salaires NBA 2018. Si ces données n’étaient pas publiques, le risque de ré-identification serait élevé. Par exemple, comme il n’y a qu’un seul « Aaron Brooks » en NBA, il pourrait être possible de déduire d’autres informations sensibles, comme son salaire annuel exact. En supprimant les noms personnels du jeu de données, vous évitez d’éventuels préjudices pour les personnes concernées.
La méthode .name() génère des noms aléatoires, y compris des prénoms féminins. En plus de cela, vous allez aussi créer des noms d’un seul genre.
Le DataFrame a été chargé dans nba.
Cet exercice fait partie du cours
Confidentialité des données et anonymisation en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the Faker class
____
# Initialize the generator
____