Menerapkan k-anonymity pada himpunan data
Dalam latihan ini, Anda akan menganonimkan himpunan data NBA Salaries. Ingat, Anda perlu menentukan jenis atribut untuk menerapkan k-anonymity. Atribut dapat berupa pengenal, kuasi-pengenal, sensitif, atau tidak sensitif. Kita akan fokus pada age dan nba_origin sebagai kuasi-pengenal dan salary sebagai data sensitif.
Jelajahi nba. Jika Anda mengetahui informasi tentang seorang pemain, misalnya ia berasal dari Spanyol dan berusia 23 tahun, maka Anda dapat mengetahui informasi sensitif seperti gajinya! Di sini, kita akan menggunakan nilai K sebesar 3, memastikan bahwa atribut terpilih tidak dapat dibedakan dari setidaknya k-1 baris lainnya.
Kamus hierarki untuk nba_Origin sudah dibuat sebagai origin_hierarchy.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print how many unique combinations are for age and nba_origin
print(____)