1. 学ぶ
  2. /
  3. コース
  4. /
  5. R에서의 차원 축소

Connected

演習

특성 중요도를 활용해 데이터 축소하기

이제 전체 랜덤 포레스트 모델을 만든 뒤, 특성 중요도를 살펴보겠습니다.

랜덤 포레스트 모델은 본질적으로(암묵적으로) 특성 선택을 수행하지만, 축소된 모델을 따로 만드는 것이 유리할 때가 많습니다. 축소된 모델은 학습과 예측이 더 빠르고, 이해와 관리도 더 쉽습니다. 물론 모델 단순성과 성능 사이에는 항상 균형이 필요합니다.

이 연습 문제에서는 데이터 세트를 축소합니다. 다음 연습 문제에서는 축소된 모델을 적합하고 전체 모델과 성능을 비교합니다. rf_fit, train, test가 제공됩니다.

tidyverse, tidymodels, vip 패키지는 미리 로드되어 있습니다.

指示

100 XP
  • vi()와 rank 매개변수를 사용해 가장 중요한 10개 특성을 추출하세요.
  • 상위 특성 목록에 타깃 변수를 다시 추가하세요.
  • 상위 특성 마스크를 적용해 데이터 세트를 축소하세요.