1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 사기 탐지

Connected

Exercise

SMOTE 적용하기

이 연습 문제에서는 Synthetic Minority Over-sampling Technique(SMOTE)를 사용해 데이터를 다시 균형 잡아 보려고 해요. ROS와 달리 SMOTE는 관측치를 그대로 복제하지 않고, 소수 클래스의 기존 관측치와 매우 유사한 새로운 합성 샘플을 생성합니다. 따라서 SMOTE는 관측치를 단순 복사하는 것보다 조금 더 정교한 방법이에요. 신용카드 데이터에 SMOTE를 적용해 보겠습니다. 데이터셋 df는 준비되어 있고, SMOTE에 필요한 패키지도 이미 임포트되어 있어요. 다음 연습 문제에서는 결과를 시각화하고 원본 데이터와 비교해서, SMOTE를 적용했을 때의 효과를 분명하게 확인해 보겠습니다.

Instrukcje

100 XP
  • df에 prep_data 함수를 적용해 특성 X와 레이블 y를 만드세요.
  • 리샘플링 방법을 일반 형태의 SMOTE로 정의하고 변수 method에 저장하세요.
  • 원본 X와 y에 .fit_resample()을 사용해 새로 리샘플링된 데이터를 얻으세요.
  • plot_data() 함수를 사용해 리샘플링된 데이터를 시각화하세요.