1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Kết hợp các phương pháp tiền xử lý

Đối số preProcess của train() không chỉ giới hạn ở việc bù khuyết giá trị thiếu. Nó còn bao gồm rất nhiều kỹ thuật preProcess khác giúp công việc của bạn với vai trò data scientist trở nên dễ dàng hơn. Bạn có thể xem danh sách đầy đủ bằng cách gõ ?preProcess và đọc trang trợ giúp của hàm này.

Một nhóm hàm tiền xử lý đặc biệt hữu ích cho mô hình hồi quy là chuẩn hóa: centering và scaling. Trước tiên, bạn center bằng cách trừ đi giá trị trung bình của từng cột khỏi từng giá trị trong cột đó, sau đó bạn scale bằng cách chia cho độ lệch chuẩn.

Chuẩn hóa biến đổi dữ liệu của bạn sao cho với mỗi cột, trung bình là 0 và độ lệch chuẩn là 1. Điều này giúp các mô hình hồi quy dễ tìm được nghiệm tốt hơn.

Hướng dẫn 1/2

undefined XP
  • 1

    breast_cancer_x và breast_cancer_y đã được nạp vào môi trường làm việc của bạn. Khớp một mô hình hồi quy logistic dùng bù khuyết theo trung vị, đặt tên là model, cho dữ liệu ung thư vú, rồi in nó ra console.

  • 2

    Cập nhật mô hình để bổ sung thêm hai bước tiền xử lý: centering và scaling.