1. 学习
  2. /
  3. 课程
  4. /
  5. R의 caret로 배우는 Machine Learning

Connected

练习

사용자 지정 학습/테스트 인덱스 만들기

영상에서 보신 것처럼, 이번 장에서는 이전 장에서 다룬 모든 개념을 하나로 묶어 주는 실제 데이터셋에 집중합니다.

churn 데이터셋에는 다양한 통신사 고객 정보가 담겨 있으며, 어떤 고객이 서비스를 해지(churn)할지를 예측하는 것이 모델링 과제입니다.

이번 장에서는 glmnet과 rf 두 가지 유형의 예측 모델을 살펴봅니다. 따라서 먼저 두 모델을 신뢰성 있게 비교할 수 있도록 재사용 가능한 trainControl 객체를 만들어 보겠습니다.

说明

100 XP

churn_x와 churn_y가 작업 공간에 로드되어 있습니다.

  • createFolds()를 사용해 이번 연습 문제의 타깃 변수인 churn_y에 대해 5개의 CV 폴드를 만드세요.
  • 생성한 폴드를 trainControl()에 전달하여, 모델 비교에 재사용할 수 있는 trainControl을 만드세요.