1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Tạo các chỉ mục train/test tùy chỉnh

Như bạn đã thấy trong video, ở chương này bạn sẽ tập trung vào một bộ dữ liệu thực tế để liên kết tất cả các khái niệm đã thảo luận ở các chương trước.

Bộ dữ liệu churn chứa thông tin về nhiều khách hàng viễn thông và thách thức mô hình là dự đoán khách hàng nào sẽ hủy dịch vụ (churn).

Trong chương này, bạn sẽ khám phá hai loại mô hình dự đoán: glmnet và rf, nên việc đầu tiên là tạo một đối tượng trainControl có thể tái sử dụng để bạn so sánh chúng một cách nhất quán.

Hướng dẫn

100 XP

churn_x và churn_y đã được nạp trong không gian làm việc của bạn.

  • Dùng createFolds() để tạo 5 fold CV trên churn_y, biến mục tiêu cho bài tập này.
  • Truyền các fold đó vào trainControl() để tạo một trainControl có thể tái sử dụng nhằm so sánh các mô hình.