1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

So sánh điền khuyết KNN và điền khuyết theo trung vị

Tất cả các bước tiền xử lý trong hàm train() đều được thực hiện trên tập huấn luyện của từng lần gấp cross-validation, vì vậy các chỉ số lỗi được báo cáo đã bao gồm tác động của việc tiền xử lý.

Điều này bao gồm cả phương pháp điền khuyết dùng (ví dụ: knnImpute hoặc medianImpute). Điểm này rất hữu ích vì nó cho phép bạn so sánh các phương pháp điền khuyết khác nhau và chọn phương pháp dự đoán ngoài mẫu tốt nhất.

median_model và knn_model đã có sẵn trong workspace của bạn, cùng với resamples, đối tượng chứa kết quả lấy mẫu lại của cả hai mô hình. Hãy xem kết quả của các mô hình bằng cách gọi

dotplot(resamples, metric = "ROC")

và chọn phương pháp cho kết quả ngoài mẫu tốt nhất. Phương pháp điền khuyết nào cho điểm ROC ngoài mẫu cao nhất với mô hình glm của bạn?

Hướng dẫn

50 XP

Các phương án trả lời