MulaiMulai sekarang secara gratis

Generalisasi menjadi rentang

K-anonymity dapat menjadi model privasi yang baik untuk himpunan data tertentu yang tidak memiliki banyak dimensi. Dua teknik anonimisasi utama yang digunakan untuk mentransformasikan himpunan data menjadi tabel k-anonim adalah generalisasi dan supresi.

Dalam latihan ini, Anda akan mentransformasikan himpunan data penilaian kepuasan menjadi tabel 3-anonim yang memuat atribut sensitif seperti satisfaction_rate dan work_hours. Beberapa kombinasi muncul kurang dari tiga kali. Perbaiki agar DataFrame menjadi 3-anonim.

DataFrame tersedia sebagai employees. Nilai k sebesar 3 juga tersedia.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate how many unique combinations are for BirthYear and Department
print(employees.groupby(['birth_year','department']).____)
Edit dan Jalankan Kode