1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tidyverse로 배우는 Machine Learning

Connected

Bài tập

교차 검증 데이터 프레임

테스트 데이터로 일부 데이터를 따로 보관해 두었으니, 이제 나머지 데이터를 활용해 가장 성능이 좋은 모델을 찾을 수 있습니다.

이번 연습 문제에서는 rsample 패키지의 vfold_cv() 함수를 사용하여 훈련 데이터를 5개의 train-validate 세트로 분할해 보겠습니다.

Hướng dẫn

100 XP
  • vfold_cv()를 사용하여 training_data에서 5-겹 교차 검증용 데이터 프레임을 만들고 cv_split에 할당하세요.
  • cv_split에 새로운 열 두 개를 추가하여 cv_data를 준비하세요:
    • train: splits 열에 training()을 매핑하여 얻은 train 데이터 프레임을 담습니다.
    • validate: splits 열에 testing()을 매핑하여 얻은 validate 데이터 프레임을 담습니다.