1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Huấn luyện mô hình hồi quy logistic

Khi đã có tập huấn luyện và tập kiểm tra ngẫu nhiên, bạn có thể huấn luyện mô hình hồi quy logistic trên tập huấn luyện bằng hàm glm(). glm() là phiên bản nâng cao của lm() cho phép xây dựng nhiều loại mô hình hồi quy hơn, không chỉ hồi quy bình phương nhỏ nhất thông thường.

Nhớ truyền đối số family = "binomial" vào glm() để chỉ định rằng bạn muốn dùng hồi quy logistic (thay vì hồi quy tuyến tính). Ví dụ:

glm(Target ~ ., family = "binomial", dataset)

Đừng lo về các cảnh báo như glm.fit: algorithm did not converge hoặc glm.fit: fitted probabilities numerically 0 or 1 occurred. Đây là những cảnh báo thường gặp với các tập dữ liệu nhỏ và thường không gây vấn đề gì. Chúng thường có nghĩa là dữ liệu của bạn phân tách hoàn hảo, điều này có thể gây khó khăn về mặt toán học cho mô hình, nhưng hàm glm() của R gần như luôn đủ vững để xử lý trường hợp này mà không gặp trục trặc.

Khi đã có mô hình glm() khớp với dữ liệu, bạn có thể dự đoán kết quả (ví dụ: rock hay mine) trên tập test bằng hàm predict() với đối số type = "response":

predict(my_model, test, type = "response")

Hướng dẫn

100 XP
  • Huấn luyện một mô hình hồi quy logistic tên model để dự đoán Class sử dụng tất cả biến còn lại làm biến dự báo. Dùng tập huấn luyện của Sonar.
  • Dự đoán trên tập test bằng mô hình đó. Đặt kết quả là p như trước đây bạn đã làm.