BaşlayınÜcretsiz başlayın

Bir veri kümesini k-anonimleştirme

Bu egzersizde, NBA Salaries veri kümesini anonimleştireceksin. Unutma, k-anonimlik uygulamak için öznitelik türlerini belirtmen gerekir. Bunlar tanımlayıcı, yarı tanımlayıcı (quasi-identifying), hassas veya hassas olmayan olabilir. Biz age ve nba_origin alanlarını yarı tanımlayıcı, salary alanını ise hassas veri olarak ele alacağız.

nba veri kümesini incele. Bir oyuncu hakkında, örneğin İspanya'dan olduğuna ve 23 yaşında olduğuna dair bir bilgin varsa, maaşı gibi hassas bilgilere de ulaşabilirsin! Burada K değerini 3 olarak kullanacağız; böylece seçilen öznitelikler en az k-1 başka satırla ayırt edilemez olacak.

nba_Origin için hiyerarşi sözlüğü origin_hierarchy olarak zaten oluşturuldu.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Print how many unique combinations are for age and nba_origin
print(____)
Kodu Düzenle ve Çalıştır