1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 데이터 프라이버시와 익명화

Connected

Exercise

faker로 이름 제거하기

이 연습 문제에서는 2018 NBA 연봉 데이터셋을 사용해요. 이 데이터가 공개되어 있지 않았다면, 재식별 공격의 위험이 매우 컸을 거예요. 예를 들어, NBA에 "Aaron Brooks"가 한 명뿐이라면, 그의 연간 정확한 연봉과 같은 민감한 정보를 유추할 수 있어요. 데이터셋에서 개인 이름을 제거하면 포함된 사람들에게 발생할 수 있는 잠재적 피해를 줄일 수 있습니다.

.name() 메서드는 무작위 이름을 생성하며, 여성 이름도 포함될 수 있어요. 여기에 더해, 단일 성별의 이름만 생성하는 방법도 함께 연습해 보겠습니다.

nba라는 이름의 DataFrame이 로드되어 있습니다.

Instructions 1/3

undefined XP
  • 1
    • Faker 클래스를 임포트하세요.
    • faker 생성기를 fake_data로 초기화하세요.
  • 2
    • player 열에 lambda 함수를 적용해 faker의 .name() 메서드로 NBA 선수 이름을 변경하세요.
  • 3
    • 남성 이름만 생성하세요.