PCA ile veri maskeleme
Sözde anonimleştirme için PCA, şirketler arasında yaygın olarak kullanılır. PCA dönüşümlerinden geçirilmiş verilerin sağlandığı çok sayıda Kaggle yarışması ve veri kümesi bulabilirsin.
PCA'nın diferansiyel gizlilikli bir sürümü de diffprivlib içinde models modülünde bulunur. Bu sürüm, sklearn'ün PCA sınıfını temel alır ancak epsilon ile minimum ve maksimum sınırlar için isteğe bağlı argümanlar içerir. Tıpkı önceki bölümde gördüğümüz gibi.
Bu egzersizde, halihazırda players olarak yüklenmiş NBA Salaries veri kümesi üzerinde PCA ile veri maskeleme uygulayacaksın.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırEgzersiz talimatları
sklearniçindenPCAyı içe aktar.PCA()yı, bileşen sayısı sütun sayısıyla aynı olacak şekilde başlat.pcayıplayersa uygula.- Ortaya çıkan veri kümesini incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import PCA from Scikit-learn
____
# Initialize PCA with number of components to be the same as the number of columns
pca = ____
# Apply PCA to the data
players_pca = ____
# Print the resulting dataset
print(pd.DataFrame(players_pca))