Mulai sekarangMulai gratis

Generalisasi menjadi rentang

K-anonymity dapat menjadi model privasi yang baik untuk himpunan data tertentu yang tidak memiliki banyak dimensi. Dua teknik anonimisasi utama yang digunakan untuk mentransformasikan himpunan data menjadi tabel k-anonim adalah generalisasi dan supresi.

Dalam latihan ini, Anda akan mentransformasikan himpunan data penilaian kepuasan menjadi tabel 3-anonim yang memuat atribut sensitif seperti satisfaction_rate dan work_hours. Beberapa kombinasi muncul kurang dari tiga kali. Perbaiki agar DataFrame menjadi 3-anonim.

DataFrame tersedia sebagai employees. Nilai k sebesar 3 juga tersedia.

Latihan ini merupakan bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Edit dan Jalankan Kode