과도하게 성장하는 트리 방지

전체 지원자 데이터로 학습한 트리는 수백 개의 분기와, 소수의 지원자만 포함한 리프 노드가 생길 정도로 매우 크고 복잡해졌습니다. 이런 트리는 대출 심사자가 해석하기 거의 불가능합니다.

조기 중지를 위한 사전 가지치기(pre-pruning) 방법을 사용하면 트리가 너무 크고 복잡해지는 것을 막을 수 있어요. rpart의 최대 트리 깊이와 최소 분할 수 제어 옵션이 결과 트리에 어떤 영향을 주는지 살펴보세요.

loans_train과 loans_test 데이터셋이 준비되어 있고, rpart도 미리 로드되어 있습니다.