1. 학습
  2. /
  3. 강의
  4. /
  5. Tidyverse로 배우는 Machine Learning

Connected

연습 문제

훈련-테스트-검증 데이터 준비하기

이번 연습 문제에서는 지금까지 배운 도구를 활용하여 직원 이직 여부를 예측하는 분류 모델을 구축합니다.

attrition 데이터셋을 사용할 것입니다. 이 데이터셋에는 직원에 관한 30가지 특성이 포함되어 있으며, 이를 바탕으로 직원이 회사를 떠났는지 예측합니다.

먼저 훈련 및 테스트 데이터셋을 준비한 후, 교차 검증을 사용해 훈련 데이터를 추가로 분할하여 이 작업에 가장 적합한 모델을 탐색합니다.

지침 1/2

undefined XP
    1
    2
  • initial_split() 함수를 사용하여 데이터를 훈련 75%, 테스트 25%로 분할하세요.
  • training()과 testing()을 사용하여 data_split에서 훈련 및 테스트 데이터 프레임을 각각 추출하세요.