1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu Bayesian với Python

Connected

Bài tập

Ước lượng lỗi kiểm thử

Giờ bạn đã có posterior_predictive (có sẵn trong không gian làm việc), bạn có thể đánh giá hiệu năng mô hình trên dữ liệu mới. Để làm điều này, bạn sẽ cần lặp qua các quan sát trong tập kiểm thử và với mỗi quan sát, tính lỗi dự đoán bằng hiệu giữa phân phối dự đoán cho quan sát đó và giá trị thực tế. Việc này sẽ cho bạn phân phối lỗi của mô hình, sau đó bạn có thể trực quan hóa.

Bạn sẽ cần pymc3 và numpy, đã được nhập sẵn lần lượt là pm và np. Dữ liệu kiểm thử, bikes_test, cũng có sẵn trong không gian làm việc. Bắt đầu thôi!

Hướng dẫn

100 XP
  • Khởi tạo errors là một danh sách rỗng.
  • Với mỗi hàng trong bikes_test, tính lỗi dự đoán bằng các mẫu dự đoán cho hàng này từ posterior_predictive trừ đi giá trị thực duy nhất num_bikes từ hàng đó.
  • Định hình lại errors bằng cách chuyển chúng thành một mảng numpy và áp dụng phương thức .reshape() lên kết quả, rồi gán kết quả cuối cùng cho error_distribution.
  • Vẽ phân phối lỗi kiểm thử bằng hàm plot_posterior() của pymc3.