1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 사기 탐지

Connected

연습 문제

통계를 활용해 정상 행동 정의하기

이전 연습 문제에서 사기가 특정 거래 범주에서 더 자주 발생한다는 점은 확인했지만, 예를 들어 연령대처럼 데이터를 명확히 세분화할 방법은 보이지 않았어요. 이번에는 정상 거래와 사기 거래에서의 평균 지출 금액을 살펴보겠습니다. 이를 통해 사기 거래가 정상 거래와 구조적으로 어떻게 다른지 가늠할 수 있어요.

지침

100 XP
  • 사기와 비사기 관측치에서 각각 두 개의 새로운 데이터프레임을 만드세요. df에서 .loc으로 데이터를 선택하고, 새 데이터프레임을 만들 때 조건으로 "fraud가 1인 경우"와 "fraud가 0인 경우"를 지정하세요.
  • 새로 만든 데이터프레임들의 amount 열을 히스토그램으로 그리세요. 각 플롯의 레이블은 각각 fraud와 nonfraud로 지정하세요.