1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Bài tập

So sánh giá trị dự đoán

Ở bài trước, bạn đã khớp cả mô hình hồi quy tuyến tính và GLM (logistic) với dữ liệu crab, dự đoán y từ width. Nói cách khác, bạn muốn dự đoán xác suất rằng con cái có một con cua vệ tinh ở gần dựa trên chiều rộng của nó.

Trong bài này, bạn sẽ xem xét sâu hơn các xác suất ước lượng (đầu ra) từ hai mô hình và cố gắng suy luận xem đường khớp tuyến tính có phù hợp với bài toán này hay không.

Thông lệ là kiểm tra mô hình trên dữ liệu mới, chưa từng thấy. Bộ dữ liệu như vậy được gọi là mẫu test. Mẫu test đã được tạo sẵn và nạp vào không gian làm việc. Lưu ý rằng bạn cần các giá trị test cho mọi biến có trong mô hình, trong ví dụ này là width.

Bộ dữ liệu crab đã được nạp sẵn vào không gian làm việc.

Hướng dẫn

100 XP
  • Dùng print() để xem tập test.
  • Với mẫu test, tính các xác suất ước lượng bằng .predict() trên mô hình tuyến tính đã khớp model_LM và lưu là pred_lm. Đồng thời, tính các xác suất ước lượng bằng .predict() trên mô hình GLM (logistic) đã khớp model_GLM và lưu là pred_glm.
  • Dùng DataFrame() của pandas để kết hợp các dự đoán từ cả hai mô hình và lưu là predictions.
  • Nối test và predictions và lưu là all_data. Xem all_data bằng print().