Mulai sekarangMulai gratis

Menerapkan k-anonymity pada himpunan data

Dalam latihan ini, Anda akan menganonimkan himpunan data NBA Salaries. Ingat, Anda perlu menentukan jenis atribut untuk menerapkan k-anonymity. Atribut dapat berupa pengenal, kuasi-pengenal, sensitif, atau tidak sensitif. Kita akan fokus pada age dan nba_origin sebagai kuasi-pengenal dan salary sebagai data sensitif.

Jelajahi nba. Jika Anda mengetahui informasi tentang seorang pemain, misalnya ia berasal dari Spanyol dan berusia 23 tahun, maka Anda dapat mengetahui informasi sensitif seperti gajinya! Di sini, kita akan menggunakan nilai K sebesar 3, memastikan bahwa atribut terpilih tidak dapat dibedakan dari setidaknya k-1 baris lainnya.

Kamus hierarki untuk nba_Origin sudah dibuat sebagai origin_hierarchy.

Latihan ini merupakan bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Print how many unique combinations are for age and nba_origin
print(____)
Edit dan Jalankan Kode