1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

연습 문제

더 변별력 있는 모델 만들기

이전 연습 문제에서는 부도 확률 예측값의 범위가 꽤 좁았어요. 말씀드렸듯이, 부도율이 낮을 때는 예측된 부도 확률이 작게 나오는 것이 일반적이지만, 더 큰 모델(즉, 더 많은 예측 변수를 포함하는 모델)을 만들면 예측값의 범위를 넓힐 수 있어요.

이렇게 했을 때 예측이 실제로 더 좋아지는지는 아직 검증이 필요하며, 새로 포함한 예측 변수의 품질에 달려 있어요. 우선, 더 큰 모델이 어떻게 예측 범위를 확장하는지 살펴보세요.

지침

100 XP
  • 데이터셋의 모든 사용 가능한 예측 변수를 포함해, log_model_small을 만들었던 방식으로 log_model_full을 만드세요. 각 열 이름을 일일이 입력하고 싶지 않다면, loan_status ~ .를 사용해 모든 변수를 한 번에 선택할 수 있어요.
  • 테스트 세트의 모든 케이스에 대해 predict()를 사용해 예측 벡터 predictions_all_full을 만드세요. 이 값들은 부도 확률을 나타낸다는 점에 유의하세요.
  • 예측값의 범위를 확인하세요.