1. Învăţa
  2. /
  3. Courses
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

exercise

더 줄일 수 있을까요?

변수 loan_amnt를 삭제하니 AUC가 0.6548까지 더 개선되었어요! 결과 모델은 다음과 같습니다.

log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat, family = binomial, data = training_set) 

로지스틱 회귀 모델을 AUC를 낮추지 않으면서 두 개 변수만 남겨서 줄일 수 있을까요? 이번 연습에서 가능한지 확인해 보겠습니다!

Instrucţiuni

100 XP
  • 모델 log_4_remove_amnt에서 다시 한 번에 하나의 변수를 제거하세요. 기본 링크 함수(logit)를 사용해야 한다는 점을 기억하세요.
  • 각 모델에 대해 predict()로 부도 확률 예측을 생성하세요.
  • 세 모델 각각에 대해 AUC를 구하세요. 첫 번째 인자에는 test_set$loan_status를, 두 번째 인자에는 각 모델의 예측값을 넣습니다.
  • 작업공간에서 AUC가 가장 높은 모델의 ROC 곡선을 plot(roc())로 그리세요. 이때 roc()의 인자 구성은 AUC가 가장 높았던 auc()에 사용한 인자와 동일합니다. log_4_remove_amnt 모델보다 더 이상 AUC가 줄어들지 않을 수도 있다는 점을 유의하세요. 이 모델의 예측값은 pred_4_remove_amnt로 이미 작업공간에 로드되어 있으며, 이 모델이 가장 높은 AUC를 보이는 경우 이를 사용하시면 됩니다.