1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 사기 탐지

Connected

Exercise

자연 적중률

이번 연습 문제에서는 다시 신용카드 거래 데이터를 사용해 볼 거예요. 특성과 레이블은 이전 장의 데이터와 비슷하고, 데이터는 심하게 불균형해요. 이미 특성 X와 레이블 y를 제공해 두었으며, 둘 다 NumPy 배열이에요.

먼저 이 데이터셋에서 사기가 얼마나 흔한지 살펴보고, 모든 사례를 비사기로 예측했을 때의 "자연 정확도(natural accuracy)"가 무엇인지 이해해야 해요. 아무것도 하지 않는 것보다 더 나은 예측을 하려면 어느 수준의 "정확도"를 넘어서야 하는지 아는 것이 중요해요. 다음 연습 문제들에서는 사기 탐지를 위한 첫 번째 랜덤 포레스트 분류기를 만들 거예요. 이는 이후 연습에서 개선해 나갈 "베이스라인" 모델이 될 거예요.

Instructions

100 XP
  • 레이블 y의 길이를 사용해 전체 관측치 수를 세세요.
  • y에 리스트 컴프리헨션을 사용해 비사기 사례 수를 세세요. y는 NumPy 배열이므로 이 경우 .value_counts()는 사용할 수 없다는 점을 기억하세요.
  • 비사기 사례 수를 전체 관측치로 나누어 자연 정확도를 계산하세요.
  • 퍼센트를 출력하세요.