1. Lära sig
  2. /
  3. Courses
  4. /
  5. R에서의 차원 축소

Connected

exercise

훈련용과 테스트용 세트로 분할하기

모델을 학습하는 첫 단계는 데이터를 훈련 세트와 테스트 세트로 나누는 것입니다. tidymodels 패키지를 사용하면 이 작업을 쉽게 할 수 있어요. 테스트 데이터 세트를 따로 떼어 두면, 모델이 한 번도 보지 못한 데이터로 학습된 모델을 평가할 수 있습니다.

이번에는 의료 기업 직원의 이직 여부 정보를 담은 employee healthcare attrition 데이터를 사용합니다. 데이터는 attrition_df에 있으며, 목표 변수는 Attrition입니다.

tidyverse와 tidymodels 패키지는 미리 불러와 두었습니다.

Instruktioner

100 XP
  • 목표 변수 Attrition을 기준으로 층화하고, 학습용 비율이 80%가 되도록 데이터 분할을 초기화하세요.
  • 훈련 데이터 세트를 추출해 train에 저장하세요.
  • 테스트 데이터 세트를 추출해 test에 저장하세요.