ComenzarEmpieza gratis

Aplicar k-anonimato a un conjunto de datos

En este ejercicio, vas a anonimizar el conjunto de datos de sueldos de la NBA. Recuerda que necesitas especificar tipos de atributos para aplicar k-anonimato. Estos pueden ser identificadores, cuasiidentificadores, sensibles o no sensibles. Nos centraremos en age y nba_origin como cuasiidentificadores y salary como dato sensible.

Explora nba. Si sabes algo de un jugador, como que es de España y tiene 23 años, entonces podrás conocer información sensible como su sueldo. Aquí usaremos un valor de K de 3, garantizando que los atributos elegidos no se puedan distinguir con al menos k-1 filas más.

El diccionario de jerarquías para nba_Origin ya está creado como origin_hierarchy.

Este ejercicio forma parte del curso

Privacidad de datos y anonimización en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print how many unique combinations are for age and nba_origin
print(____)
Editar y ejecutar código