1. 学习
  2. /
  3. 课程
  4. /
  5. R로 배우는 네트워크 데이터 기반 Predictive Analytics

Connected

练习

학습용과 테스트용으로 분할하기

이제 데이터프레임이 준비되었으니, 표준 모델링 기법을 적용할 수 있어요. 이 연습 문제에서는 데이터를 학습용 세트와 테스트용 세트로 나누겠습니다.

说明

100 XP
  • 결과 재현성을 위해 set.seed()를 사용하여 시드를 7로 설정하세요.
  • sample() 함수를 사용해 studentnetworkdata의 전체 행 수 범위에서 생성한 수열 중 3분의 2를 추출하세요. 이 벡터의 이름은 index_train으로 지정하세요.
  • index_train에 저장된 행을 포함하여 studentnetworkdata에서 학습용 세트를 만들고, 이름을 training_set으로 지정하세요.
  • index_train에 저장된 행을 제외하여 studentnetworkdata에서 테스트용 세트를 만들고, 이름을 test_set으로 지정하세요.