1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 Support Vector Machine

Connected

연습 문제

훈련 세트와 테스트 세트 만들기

데이터셋을 훈련 세트와 테스트 세트로 나누는 것은 분류 모델을 만들고 검증하는 데 중요한 단계입니다. 훈련 세트는 모델을 학습하는 데, 테스트 세트는 예측 정확도를 평가하는 데 사용합니다.

이 연습에서는 이전 장에서 만들었던 데이터셋을 훈련 세트와 테스트 세트로 나눠 보겠습니다. 데이터셋은 데이터 프레임 df에 로드되어 있고, 재현성을 위해 시드도 이미 설정되어 있습니다. 이전 영상에서 훈련 세트 길이의 상한을 몇 가지 유용한 함수로 설정했음을 떠올려 보세요. 이제 직접 구현해 보세요!

지침

100 XP
  • 훈련 세트에 포함될 행 수의 상한을 구해 sample_size에 저장하세요.
  • 80/20 비율에 따라 무작위로 할당된 훈련 세트를 저장하는 벡터 train을 생성하세요.
  • train 벡터의 행들을 데이터 프레임 trainset에 할당하고, 나머지는 데이터 프레임 testset에 할당하세요.