1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Feature Engineering

Connected

연습 문제

변수 중요도 살펴보기

attrition 데이터셋에는 "Attrition"을 위한 839개의 관측치와 30개의 예측 변수가 있습니다. 사용 가능한 모든 예측 변수를 쓰는 모델과, 일부 정보량이 높은 변수만 사용하는 축소 모델 간의 성능 균형을 탐색해 보려 합니다.

이번 연습에서는 모델을 적합하고, 적합된 모델의 변수 중요도를 살펴봅니다. 다음 연습에서는 이 모델과 축소 모델의 성능을 비교해 평가합니다.

train과 test 분할, vip() 패키지, 그리고 미리 선언된 로지스틱 회귀 model이 환경에 준비되어 있습니다.

지침

100 XP
  • 모든 예측 변수를 사용해 Attrition을 모형화하는 레시피를 만드세요.
  • 워크플로를 학습 데이터에 적합하세요.
  • fit_full 객체를 사용해 모델의 변수 중요도를 그래프로 나타내세요.
  • vip() 전에 extract_fit_parsnip() 함수를 적용해 필요한 정보를 전달하세요.