1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

연습 문제

교차 검증 계획 만들기

n-겹 교차 검증 계획을 구현하는 방법은 여러 가지가 있습니다. 이 연습 문제에서는 vtreat::kWayCrossValidation()을 사용해 이런 계획을 만들고, 이를 살펴보겠습니다.

kWayCrossValidation()은 다음과 같이 호출해 교차 검증 계획을 생성합니다:

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

여기서 nRows는 분할할 데이터의 행 수이고, nSplits는 원하는 교차 검증 폴드 수입니다.

엄밀히 말하면 dframe과 y는 kWayCrossValidation에서 사용되지 않습니다. 다른 vtreat 데이터 분할 함수들과의 호환성을 위해 존재하므로, 둘 다 NULL로 설정해도 됩니다.

생성된 splitPlan은 nSplits개의 요소로 이루어진 리스트이며, 각 요소는 두 개의 벡터를 포함합니다:

  • train: 학습 세트를 구성할 dframe의 인덱스
  • app: 테스트(또는 적용) 세트를 구성할 dframe의 인덱스

이 연습 문제에서는 데이터셋 mpg에 대해 3-겹 교차 검증 계획을 만듭니다.

지침

100 XP
  • 패키지 vtreat을(를) 불러오세요.
  • mpg의 행 개수를 구해 변수 nRows에 할당하세요.
  • kWayCrossValidation을(를) 호출해 3-겹 교차 검증 계획을 만들고 변수 splitPlan에 할당하세요.
    • 함수의 마지막 두 인수는 NULL로 설정해도 됩니다.
  • str()을(를) 호출해 splitPlan의 구조를 확인하세요.