Aplicar k-anonimato a un conjunto de datos
En este ejercicio, vas a anonimizar el conjunto de datos de sueldos de la NBA. Recuerda que necesitas especificar tipos de atributos para aplicar k-anonimato. Estos pueden ser identificadores, cuasiidentificadores, sensibles o no sensibles. Nos centraremos en age y nba_origin como cuasiidentificadores y salary como dato sensible.
Explora nba. Si sabes algo de un jugador, como que es de España y tiene 23 años, entonces podrás conocer información sensible como su sueldo. Aquí usaremos un valor de K de 3, garantizando que los atributos elegidos no se puedan distinguir con al menos k-1 filas más.
El diccionario de jerarquías para nba_Origin ya está creado como origin_hierarchy.
Este ejercicio forma parte del curso
Privacidad de datos y anonimización en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print how many unique combinations are for age and nba_origin
print(____)