BaşlayınÜcretsiz Başlayın

Bir veri kümesini k-anonimleştirme

Bu egzersizde, NBA Salaries veri kümesini anonimleştireceksin. Unutma, k-anonimlik uygulamak için öznitelik türlerini belirtmen gerekir. Bunlar tanımlayıcı, yarı tanımlayıcı (quasi-identifying), hassas veya hassas olmayan olabilir. Biz age ve nba_origin alanlarını yarı tanımlayıcı, salary alanını ise hassas veri olarak ele alacağız.

nba veri kümesini incele. Bir oyuncu hakkında, örneğin İspanya'dan olduğuna ve 23 yaşında olduğuna dair bir bilgin varsa, maaşı gibi hassas bilgilere de ulaşabilirsin! Burada K değerini 3 olarak kullanacağız; böylece seçilen öznitelikler en az k-1 başka satırla ayırt edilemez olacak.

nba_Origin için hiyerarşi sözlüğü origin_hierarchy olarak zaten oluşturuldu.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Print how many unique combinations are for age and nba_origin
print(____)
Kodu Düzenle ve Çalıştır