1. Learn
  2. /
  3. Courses
  4. /
  5. R로 배우는 Supervised Learning: 분류

Connected

Exercise

과도하게 성장하는 트리 방지

전체 지원자 데이터로 학습한 트리는 수백 개의 분기와 소수의 지원자만 있는 잎 노드를 가진, 매우 크고 복잡한 형태가 되었어요. 대출 심사 담당자가 이 트리를 해석하기는 거의 불가능하겠죠.

조기 중지를 위한 사전 가지치기(pre-pruning) 방법을 사용하면 트리가 지나치게 크고 복잡해지는 것을 막을 수 있어요. 최대 트리 깊이와 최소 분할 수에 대한 rpart 제어 옵션이 결과 트리에 어떤 영향을 주는지 확인해 보세요.

rpart는 미리 로드되어 있어요.

Instructions 1/2

undefined XP
  • 1
    • rpart()를 사용해 학습용 데이터셋과 사용 가능한 모든 예측 변수를 이용한 대출 모델을 만드세요.
      • rpart.control()로 모델 control을 설정하고, cp는 0, maxdepth는 6으로 지정하세요.
    • 더 단순한 모델의 테스트 세트 정확도가 기존 58.3% 정확도와 어떻게 비교되는지 확인하세요.
      • 먼저 predict() 함수로 예측값 벡터를 만드세요.
      • 예측값을 실제 결과와 비교하고 mean()으로 정확도를 계산하세요.
  • 2

    모델 control에서 maxdepth를 제거하고, 최소 분할 매개변수 minsplit을 500으로 추가하세요.