1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 사기 탐지

Connected

연습 문제

다수 클래스 줄이기

데이터셋에서 사기 사례 수를 늘리는 대신, 무작위로 정상 거래를 제거하여 데이터셋의 균형을 맞출 수 있습니다. creditcard 데이터셋에서 다수 클래스(Class = 0)를 언더샘플링해 보겠습니다. 콘솔에서 table()을 사용하면 데이터셋에 사기 거래와 정상 거래가 각각 몇 건인지 확인할 수 있어요.

지침

100 XP
  • ROSE 라이브러리를 불러오세요.
  • 언더샘플링된 데이터셋에서 사기 거래가 40%가 되도록 필요한 전체 사례 수 n_new를 지정하세요. 이를 위해 사기 사례 수를 언더샘플링 후 원하는 사기 비율로 나누면 됩니다.
  • 데이터셋을 언더샘플링하세요.
  • 언더샘플링된 데이터셋의 클래스 균형을 table()과 prop.table()로 확인하세요.