1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 차원 축소

Connected

연습 문제

레시피-모델 워크플로 만들기

tidymodels 패키지는 레시피와 모델을 워크플로로 결합할 수 있습니다. 워크플로를 사용하면 데이터를 준비하고 모델을 학습하는 단계를 하나의 파이프라인으로 쉽게 구성할 수 있어요. 또한 워크플로는 모든 전처리와 모델 구축 단계를 다시 정의하지 않고도 새 데이터에 손쉽게 적용할 수 있습니다. 편리하게도, 워크플로에는 레시피와 모델을 데이터에 동시에 적합하는 fit() 함수가 있습니다.

이번 연습에서는 레시피와 모델을 만들고 이를 워크플로에 추가하여 데이터에 적합할 준비를 하게 됩니다. 직원 건강관리 이탈 데이터의 train과 test 세트가 제공되며, 타깃 변수는 Attrition입니다.

tidyverse와 tidymodels 패키지는 이미 로드되어 있습니다.

지침

100 XP
  • train 데이터를 사용해 레시피를 정의하고, 각각 결측치 비율에 따른 제거를 위한 step_filter_missing(), 수치형 특성의 스케일링을 위한 step_scale(), 낮은 분산 특성 제거를 위한 step_nzv() 를 추가하세요. step_filter_missing() 의 임계값은 0.5로 사용하세요.
  • "glm" 엔진을 사용하는 로지스틱 회귀 모델을 정의하세요.
  • feature_selection_recipe 와 lr_model 을 attrition_wflow 라는 워크플로에 추가하세요.