Generalisasi menjadi rentang
K-anonymity dapat menjadi model privasi yang baik untuk himpunan data tertentu yang tidak memiliki banyak dimensi. Dua teknik anonimisasi utama yang digunakan untuk mentransformasikan himpunan data menjadi tabel k-anonim adalah generalisasi dan supresi.
Dalam latihan ini, Anda akan mentransformasikan himpunan data penilaian kepuasan menjadi tabel 3-anonim yang memuat atribut sensitif seperti satisfaction_rate dan work_hours. Beberapa kombinasi muncul kurang dari tiga kali. Perbaiki agar DataFrame menjadi 3-anonim.
DataFrame tersedia sebagai employees. Nilai k sebesar 3 juga tersedia.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)