1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 사기 탐지

Connected

연습 문제

견고한 z-점수 계산하기

1장에서 사용했던 transfers 데이터셋을 다시 살펴보겠습니다. 이 데이터셋에는 222건의 거래가 있으며, 변수 fraud_flag에 1로 표시된 알려진 사기 사례가 4건 있습니다. 우리는 이전에 빈도와 최신성 특징을 살펴봤습니다. 이번에는 amount 변수에만 집중해, 이 변수에 대해 단변량 이상치 탐지 기법을 적용하여 사기 사례를 찾아보겠습니다.

데이터 구조가 기억나지 않으면 콘솔에서 데이터셋을 자유롭게 탐색해 보세요. 이전 영상에서 소개한 함수들은 슬라이드에서도 확인할 수 있어요.

지침

100 XP
  • 어떤 관측치가 사기로 식별되는지 확인하세요.
  • amount 변수의 중앙값과 중앙 절대 편차(mad)를 계산하세요.
  • 위치와 산포의 견고한 추정치를 사용해 각 관측치의 견고한 z-점수를 계산하세요.
  • 절댓값 기준으로 견고한 z-점수가 3을 초과하는 관측치는 무엇인가요?