MulaiMulai sekarang secara gratis

Menerapkan k-anonymity pada himpunan data

Dalam latihan ini, Anda akan menganonimkan himpunan data NBA Salaries. Ingat, Anda perlu menentukan jenis atribut untuk menerapkan k-anonymity. Atribut dapat berupa pengenal, kuasi-pengenal, sensitif, atau tidak sensitif. Kita akan fokus pada age dan nba_origin sebagai kuasi-pengenal dan salary sebagai data sensitif.

Jelajahi nba. Jika Anda mengetahui informasi tentang seorang pemain, misalnya ia berasal dari Spanyol dan berusia 23 tahun, maka Anda dapat mengetahui informasi sensitif seperti gajinya! Di sini, kita akan menggunakan nilai K sebesar 3, memastikan bahwa atribut terpilih tidak dapat dibedakan dari setidaknya k-1 baris lainnya.

Kamus hierarki untuk nba_Origin sudah dibuat sebagai origin_hierarchy.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print how many unique combinations are for age and nba_origin
print(____)
Edit dan Jalankan Kode