전체 랜덤 포레스트 모델 만들기

Random forest 모델은 많은 하위 트리를 특징의 무작위 부분집합에서 생성하므로 자연스럽게 특징 선택을 수행해요. 특징 중요도를 이해하는 한 가지 방법은 모델을 만든 다음 특징 중요도를 추출하는 거예요. 이번 연습에서는 Healthcare Job Attrition 데이터를 사용해 특징 중요도를 추출할 수 있는 rand_forest() 분류 모델을 학습하겠습니다. 특징 중요도를 사용할 수 있도록 모델을 만들 때 importance = "impurity"로 설정하세요. train과 test 세트가 제공되어 있어요.

tidyverse, tidymodels, vip 패키지는 미리 로드되어 있어요.