1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

연습 문제

변수 중요도

배깅 트리는 결정 트리의 분산 문제를 극복하는 앙상블 모델이라는 것을 이미 알고 계시죠. 여기에 무작위 숲(random forest)은 각 트리에서 무작위로 선택한 일부 특성만 사용해 이를 한 단계 더 발전시킵니다. 이렇게 하면 앙상블 간 상관이 더 낮아져 예측 성능이 향상돼요.

이번 연습에서는 직접 random forest를 만들고 vip 패키지를 사용해 예측 변수의 중요도를 시각화해 보겠습니다. 학습 데이터 customers_train은 워크스페이스에 미리 로드되어 있습니다.

지침

100 XP
  • "ranger" 엔진과 "impurity" 변수 중요도를 사용하는 random forest 분류 모델 사양인 spec을 생성하세요.
  • customers_train 티블을 사용해 종속변수는 still_customer, 나머지 모든 열을 예측 변수로 하여 spec에 적합해 model을 생성하세요.
  • 사전 로드되어 있지 않은 vip 패키지의 vip() 함수를 사용해 변수 중요도를 시각화하세요.