부도 확률 예측하기

영상에서는 테스트 세트의 한 사례에 대해 예측된 부도 확률을 살펴봤습니다. 다행히 predict() 함수를 사용하면 테스트 세트의 모든 사례에 대한 확률을 한 번에 예측할 수 있어요.

테스트 세트 요소들에 대한 모든 예측을 얻은 뒤에는, 예측 확률의 범위를 확인해 모델이 얼마나 잘 구분하는지 초기 감을 잡는 것이 좋습니다. 범위가 작다면 테스트 세트 사례들의 예측값이 서로 크게 다르지 않다는 뜻이므로, 모델이 우량 고객과 위험 고객을 잘 구분하지 못할 수 있어요. 부도율이 낮은 데이터에서는 일반적으로 매우 낮은 부도 확률이 예측되는 경향이 있습니다. 이제 첫 번째 모델을 살펴볼 시간이에요.

log_model_small이 작업 공간에 로드되어 있습니다.