1. 학습
  2. /
  3. 강의
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

연습 문제

80/20 분할 시도하기

데이터셋을 무작위로 섞었으니, 이제 처음 80%는 훈련 세트로, 마지막 20%는 테스트 세트로 나눌 수 있습니다. 데이터의 약 80% 지점에 분할 위치를 정해 이렇게 할 수 있어요:

split <- round(nrow(mydata) * 0.80)

그다음 이 지점을 사용해 데이터셋의 첫 80%를 훈련 세트로 분리합니다:

mydata[1:split, ]

같은 지점을 사용해 테스트 세트를 만들면 됩니다:

mydata[(split + 1):nrow(mydata), ]

지침

100 XP
  • diamonds 데이터셋의 약 80% 지점이 되도록 분할할 행 인덱스를 선택하세요. 이 인덱스를 split이라고 하세요.
  • 해당 인덱스를 사용해 train이라는 훈련 세트를 만드세요.
  • 같은 인덱스를 사용해 test라는 테스트 세트를 만드세요.