1. Learn
  2. /
  3. Courses
  4. /
  5. Mô hình Tuyến tính Tổng quát (GLM) trong Python

Connected

Exercise

Tính toán dự đoán

Trong thực tế, chúng ta thường muốn dùng mô hình logistic regression đã khớp để ước tính xác suất và xây dựng khoảng tin cậy cho các ước tính này. Với bộ dữ liệu wells và mô hình 'switch ~ arsenic', giả sử bạn có các quan sát mới wells_test không thuộc mẫu huấn luyện và bạn muốn dự đoán xác suất chuyển sang giếng an toàn gần nhất.

Bạn sẽ thực hiện điều này bằng phương thức .predict().

Lưu ý .predict() nhận một số đối số:

  • exog - các quan sát mới (tập dữ liệu kiểm tra)
  • transform = True - áp dụng (truyền) công thức khớp y ~ x vào dữ liệu.

Nếu không xác định exog thì xác suất sẽ được tính cho tập dữ liệu huấn luyện.

Mô hình wells_fit và các bộ dữ liệu wells và wells_test đã được nạp sẵn trong môi trường làm việc.

Instructions

100 XP
  • Dùng mô hình đã khớp wells_fit để tính dự đoán trên dữ liệu kiểm tra wells_test và lưu vào prediction.
  • Thêm prediction vào dataframe wells_test hiện có và đặt tên cột là prediction.
  • Dùng print() hiển thị 5 hàng đầu tiên của wells_test với các cột switch, arsenic và prediction. Dùng hàm pandas head() để chỉ xem 5 hàng đầu.