1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

अभ्यास

폴드 만들기

데이터를 한 번만 훈련/테스트 세트로 나누면 통계적으로 불안정할 수 있어요. 예를 들어, 테스트 세트에는 높은 평점의 빈만 들어가고 낮은 평점의 빈은 모두 훈련 세트에만 들어갈 가능성이 작지만 존재합니다. 또한 모델 성능을 한 번만 측정할 수 있다는 한계도 있어요.

교차 검증은 이런 통계적 함정을 피하면서 더 견고한 샘플 외 성능 추정치를 제공합니다. 즉, 모델을 더 깊이 평가해 줍니다.

이 연습 문제에서는 미리 로드된 훈련 데이터 chocolate_train의 폴드를 생성해 보겠습니다.

निर्देश

100 XP
  • 재현성을 위해 시드를 20으로 설정하세요.
  • chocolate_train의 폴드를 10개 만들고 결과를 chocolate_folds로 저장하세요.