ComenzarEmpieza gratis

Generalización en intervalos

K-anonymity puede ser un buen modelo de privacidad para conjuntos de datos específicos que no tienen muchas dimensiones. Las dos técnicas principales de anonimización usadas para transformar un conjunto de datos en una tabla k-anónima son la generalización y la supresión.

En este ejercicio, vas a transformar un conjunto de datos de puntuaciones de satisfacción en una tabla 3-anónima que contiene posibles atributos sensibles como satisfaction_rate y work_hours. Algunas combinaciones aparecen menos de tres veces. Corrige eso para que el DataFrame sea 3-anónimo.

El DataFrame está disponible como employees. También está disponible un valor de k igual a 3.

Este ejercicio forma parte del curso

Privacidad de datos y anonimización en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Editar y ejecutar código