1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 데이터 프라이버시와 익명화

Connected

연습 문제

PCA로 데이터 마스킹

의사 익명화를 위한 PCA는 많은 기업에서 널리 사용됩니다. PCA 변환을 거친 데이터가 제공되는 Kaggle 대회와 데이터셋도 여러 곳에서 찾아볼 수 있어요.

차등 개인정보 보호가 적용된 PCA 버전은 diffprivlib의 models 모듈에도 포함되어 있습니다. 이는 sklearn의 PCA 클래스를 기반으로 하며, 이전 장에서 보았듯이 epsilon과 최소/최대 경계를 위한 선택적 인자를 제공합니다.

이 연습 문제에서는 이미 players로 로드된 NBA Salaries 데이터셋에 PCA를 사용해 데이터 마스킹을 적용해 보겠습니다.

지침

100 XP
  • sklearn에서 PCA를 임포트하세요.
  • 구성 요소 수를 열 개수와 같게 하여 PCA()를 초기화하세요.
  • players에 pca를 적용하세요.
  • 변환된 데이터셋을 확인하세요.