사기 탐지를 위한 Random Forest 조정하기

이 연습 문제에서는 랜덤 포레스트 분류기의 옵션을 살펴보면서, 숲에 있는 결정 트리의 가중치를 지정하고 형태를 조정해 볼 거예요. 불균형을 조금 보정하기 위해 가중치를 직접 정의하겠습니다. 현재 데이터는 사기 300건, 정상 7000건이므로, 가중치 비율을 1:12로 두면 학습 시 사기 1/3, 정상 2/3에 가까운 비율로 맞춰져 모델 학습에 충분해요.

이 연습의 데이터는 이미 학습용과 테스트용으로 분할되어 있으니, 여러분은 모델 정의에만 집중하시면 돼요. 이후 get_model_results() 함수를 지름길로 사용할 수 있어요. 이 함수는 이전 연습에서 했던 단계처럼, 모델을 학습 데이터에 적합하고 예측한 뒤 성능 지표를 계산해 줍니다.