Phân phối của sai số

Hầu như không có quy trình thực tế nào có thể dự đoán hoàn hảo. Kết quả mong muốn là sai số có phân phối chuẩn. Điều này có nghĩa là một số giá trị thực tế sẽ cao hơn dự đoán của bạn và một số sẽ thấp hơn. Tức là, các sai số (ví dụ: hiệu giữa giá trị thực tế và giá trị dự đoán) sẽ như “dao động” ngẫu nhiên quanh không.

Trong bài tập này, bạn sẽ phân tích kết quả từ một mô hình tuyến tính dựng sẵn dùng để dự đoán lương của cảnh sát. Bạn sẽ xem xét sai số và kiểm tra liệu nó xấp xỉ phân phối chuẩn hay không. Các dự đoán là một danh sách giá trị lưu trong preds, và các mức lương thực tế là một danh sách giá trị lưu trong salaries.

Tính sai số bằng mức lương thực tế trừ đi mức lương dự đoán.
Vẽ histogram của các sai số.
Thực hiện kiểm định chuẩn tính Anderson–Darling cho các sai số.
Tìm và in (các) significance_level tại đó giả thuyết không bị bác bỏ.

Bài tập

Phân phối của sai số

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập