1. Lära sig
  2. /
  3. Courses
  4. /
  5. R로 배우는 신용 위험 모델링

Connected

exercise

AUC 기반 가지치기 다시 한 번

영상에서는 로짓 링크를 사용하는 "전체" 로지스틱 회귀 모델을 AUC 기준으로 가지치기(pruning)하는 과정을 보셨습니다. 전체 AUC가 개선되어 home_ownership 변수가 모델에서 제거되었고, 같은 과정을 두 번 더 반복한 결과 age와 ir_cat 변수가 제거되어 다음 모델이 만들어졌습니다:

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

이 모델의 AUC는 0.6545입니다. 이제 모델에서 변수를 하나 더 제거해 AUC를 더 개선할 수 있는지 직접 확인해 보세요.

Instruktioner

100 XP
  • 모델 log_3_remove_ir에서 한 번에 변수 하나씩 제거하세요. 기본 링크 함수(로짓)를 사용해야 합니다.
  • 생성한 각 모델에 대해 부도 확률 예측을 만드세요.
  • 각 모델의 AUC를 계산하려면 함수 auc()를 사용하세요. 첫 번째 인수는 test_set$loan_status, 두 번째 인수는 네 개 모델 각각의 예측값입니다.
  • 가장 높은 AUC를 보인 모델을 나타내는 객체 이름을(이 연습 문제의 첫 번째 질문에서 제시된 그대로) 복사해 제출하세요.