1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

연습 문제

부도 확률 예측하기

영상에서는 테스트 세트의 한 사례에 대해 예측된 부도 확률을 살펴봤습니다. 다행히 predict() 함수를 사용하면 테스트 세트의 모든 사례에 대한 확률을 한 번에 예측할 수 있어요.

테스트 세트 요소들에 대한 모든 예측을 얻은 뒤에는, 예측 확률의 범위를 확인해 모델이 얼마나 잘 구분하는지 초기 감을 잡는 것이 좋습니다. 범위가 작다면 테스트 세트 사례들의 예측값이 서로 크게 다르지 않다는 뜻이므로, 모델이 우량 고객과 위험 고객을 잘 구분하지 못할 수 있어요. 부도율이 낮은 데이터에서는 일반적으로 매우 낮은 부도 확률이 예측되는 경향이 있습니다. 이제 첫 번째 모델을 살펴볼 시간이에요.

log_model_small이 작업 공간에 로드되어 있습니다.

지침

100 XP
  • 영상에서 test_case를 예측하던 코드는 이미 작업 공간에 복사되어 있어요. 코드를 수정해 predict() 함수를 test_set의 모든 사례에 적용하세요. 예측값은 predictions_all_small 객체에 저장하면 됩니다.
  • range()를 사용해 모델이 어느 정도 구분력을 가지는지 초기 인상을 파악하세요.