Eliminar nombres con faker
En este ejercicio, vas a trabajar con el conjunto de datos de salarios de la NBA de 2018. Si estos datos no fueran públicos, habría un alto riesgo de un ataque de reidentificación. Por ejemplo, como solo hay un "Aaron Brooks" jugando en la NBA, podría ser posible conocer otra información sensible como su salario exacto por año. Al eliminar los nombres personales del conjunto de datos, puedes evitar posibles perjuicios para las personas incluidas.
El método .name() generará nombres aleatorios, incluidos algunos femeninos. Además de esto, también crearás nombres de un solo género.
El DataFrame ya se ha cargado como nba.
Este ejercicio forma parte del curso
Privacidad de datos y anonimización en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the Faker class
____
# Initialize the generator
____