1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

연습 문제

학습/테스트 분할

모델을 올바르게 평가하려면, 데이터를 두 부분으로 나눠 한쪽으로는 모델을 학습하고 다른 쪽으로는 테스트해야 해요. 그렇지 않으면 시험에서 답을 미리 알고 푸는 것과 마찬가지로, 공정하지 않게 돼요.

데이터 분할은 모델링 과정의 핵심 단계예요. 이번에는 당뇨병 데이터를 분할하고, 분할 비율이 올바른지 확인해 보겠습니다.

이전 연습 문제에서 사용한 diabetes 데이터는 워크스페이스에 미리 로드되어 있어요.

지침 1/3

undefined XP
    1
    2
    3
  • diabetes 티블을 80% 학습, 20% 테스트 데이터로 나눈 diabetes_split으로 분할하세요.
  • 결과 객체를 출력하세요.