BaşlayınÜcretsiz başlayın

PCA ile veri maskeleme

Sözde anonimleştirme için PCA, şirketler arasında yaygın olarak kullanılır. PCA dönüşümlerinden geçirilmiş verilerin sağlandığı çok sayıda Kaggle yarışması ve veri kümesi bulabilirsin.

PCA'nın diferansiyel gizlilikli bir sürümü de diffprivlib içinde models modülünde bulunur. Bu sürüm, sklearn'ün PCA sınıfını temel alır ancak epsilon ile minimum ve maksimum sınırlar için isteğe bağlı argümanlar içerir. Tıpkı önceki bölümde gördüğümüz gibi.

Bu egzersizde, halihazırda players olarak yüklenmiş NBA Salaries veri kümesi üzerinde PCA ile veri maskeleme uygulayacaksın.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Egzersiz talimatları

  • sklearn içinden PCAyı içe aktar.
  • PCA()yı, bileşen sayısı sütun sayısıyla aynı olacak şekilde başlat.
  • pcaplayersa uygula.
  • Ortaya çıkan veri kümesini incele.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import PCA from Scikit-learn
____

# Initialize PCA with number of components to be the same as the number of columns
pca = ____

# Apply PCA to the data
players_pca = ____

# Print the resulting dataset
print(pd.DataFrame(players_pca))
Kodu Düzenle ve Çalıştır