1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 사기 탐지

Connected

연습 문제

하나의 계좌에 대한 빈도 특성 만들기

빈도(feature)란 과거에 특정 사건이 얼마나 자주 발생했는지를 세는 특성입니다. 이런 특성을 만들면 비정상적인 행동을 더 잘 탐지할 수 있어요. 영상에서는 범주형 특성을 바탕으로 빈도 특성을 만드는 방법을 배웠습니다.

지금은 Bob의 거래 데이터가 제공됩니다. 그중 channel_cd라는 열은 각 거래를 할 때 Bob이 사용한 결제 채널을 나타냅니다. 여기서는 rollapply() 함수를 사용해 channel_cd 열을 바탕으로 freq_channel이라는 빈도 특성을 만들어 볼 거예요. 함수 문서는 콘솔에서 ?rollaply로 확인할 수 있습니다.

데이터셋 trans_Bob과 zoo, dplyr 패키지는 작업 공간에 이미 로드되어 있습니다.

지침

100 XP
  • frequency_fun() 함수를 작성하세요. 이 함수는 steps와 channel을 입력으로 받아, 단계 수를 세고 가장 최근 channel이 과거에 몇 번 사용되었는지 합산합니다.
  • transfer_id 열에 rollapply 함수를 사용해 freq_channel 특성을 생성하세요. 이 특성은 특정 channel_cd가 이전에 몇 번 사용되었는지를 세어야 합니다.
  • channel_cd, freq_channel, fraud_flag 특성을 출력하고, 새로 만든 특성을 확인하세요.