상호작용 항 모델링 (2)

이번 연습에서는 이전 연습에서 적합한 상호작용 모델의 성능을, 주효과만 포함한 모델의 성능과 비교해 보겠습니다. 이 데이터셋은 작기 때문에, 교차 검증을 사용해 홀드아웃 데이터에 대한 예측을 모의 실험하겠습니다.

계산을 위해 dplyr 패키지를 사용하기 시작합니다.

또한 여러 열을 키-값 쌍으로 접는 tidyr의 pivot_longer() (docs)도 사용합니다. alcohol 데이터 프레임과 수식 fmla_add, fmla_interaction은 미리 불러와져 있습니다.

kWayCrossValidation() (docs)을 사용해 3-겹 교차 검증을 위한 분할 계획을 만드세요.
- 첫 번째 인자는 분할할 행의 수입니다.
- 두 번째 인자는 교차 검증의 폴드 수입니다.
- 함수의 세 번째와 네 번째 인자는 NULL로 설정해도 됩니다.
샘플 코드를 확인하고 실행해 상호작용 항이 없는 모델의 3-겹 교차 검증 예측을 구해 pred_add 열에 할당하세요.
상호작용 항이 있는 모델의 3-겹 교차 검증 예측을 구하세요. 예측값을 pred_interaction 열에 할당하세요.
- 절차는 샘플 코드에 나와 있습니다.
- 이미 생성한 동일한 splitPlan을 사용하세요.
빈칸을 채워 다음을 수행하세요.
- 예측값을 하나의 열 pred로 pivot_longer 하세요.
- 잔차 열(실제 결과 - 예측 결과)을 추가하세요.
- 모델 유형별로 교차 검증 예측의 RMSE를 구하세요.
RMSE를 비교하세요. 이 결과를 바탕으로 어떤 모델을 사용하시겠습니까?

연습 문제