1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 데이터 프라이버시와 익명화

Connected

연습 문제

구간으로 일반화하기

K-익명성은 차원이 많지 않은 특정 데이터셋에서 유용한 프라이버시 모델이에요. 데이터셋을 k-익명 테이블로 변환할 때 주로 사용하는 두 가지 익명화 기법은 일반화와 억제(suppression)입니다.

이 연습에서는 satisfaction_rate와 work_hours 같은 민감할 수 있는 속성을 포함한 만족도 데이터셋을 3-익명 테이블로 변환해 보겠습니다. 일부 조합은 등장 횟수가 세 번 미만이에요. 이를 수정해 DataFrame이 3-익명성을 만족하도록 하세요.

DataFrame은 employees로 제공됩니다. k 값 3도 함께 제공됩니다.

지침 1/3

undefined XP
    1
    2
    3
  • birth_year와 department의 고유 조합이 몇 개인지 계산하세요.
  • .reset_index()를 사용하고, 개수를 담을 새 컬럼 이름을 name 매개변수에 count로 전달해 지정하세요.