BaşlayınÜcretsiz Başlayın

PCA ile veri maskeleme

Sözde anonimleştirme için PCA, şirketler arasında yaygın olarak kullanılır. PCA dönüşümlerinden geçirilmiş verilerin sağlandığı çok sayıda Kaggle yarışması ve veri kümesi bulabilirsin.

PCA'nın diferansiyel gizlilikli bir sürümü de diffprivlib içinde models modülünde bulunur. Bu sürüm, sklearn'ün PCA sınıfını temel alır ancak epsilon ile minimum ve maksimum sınırlar için isteğe bağlı argümanlar içerir. Tıpkı önceki bölümde gördüğümüz gibi.

Bu egzersizde, halihazırda players olarak yüklenmiş NBA Salaries veri kümesi üzerinde PCA ile veri maskeleme uygulayacaksın.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn içinden PCAyı içe aktar.
  • PCA()yı, bileşen sayısı sütun sayısıyla aynı olacak şekilde başlat.
  • pcaplayersa uygula.
  • Ortaya çıkan veri kümesini incele.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import PCA from Scikit-learn
____

# Initialize PCA with number of components to be the same as the number of columns
pca = ____

# Apply PCA to the data
players_pca = ____

# Print the resulting dataset
print(pd.DataFrame(players_pca))
Kodu Düzenle ve Çalıştır