1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

Bài tập

Phân rã phương sai thành hai phần

Giả sử có hai bộ dữ liệu quãng đường theo thời gian: một có vận tốc rất nhỏ và một có vận tốc lớn. Lưu ý rằng cả hai có thể có cùng sai số chuẩn của hệ số góc, nhưng R-squared của mô hình tổng thể lại khác nhau, tùy thuộc vào độ lớn của hệ số góc ("kích thước hiệu ứng") so với sai số chuẩn ("độ bất định").

Nếu vẽ cả hai bộ dữ liệu dưới dạng biểu đồ phân tán trên cùng một trục, sự tương phản sẽ rất rõ. Phương sai do hệ số góc gây ra khác với phương sai do nhiễu ngẫu nhiên quanh đường xu hướng. Trong bài tập này, mục tiêu của bạn là tính sai số chuẩn và R-squared cho hai bộ dữ liệu và so sánh chúng.

Hướng dẫn

100 XP
  • Xây dựng và fit() một mô hình ols() cho cả hai bộ dữ liệu distances1 và distances2.
  • Dùng .bse của các mô hình thu được model_1 và model_2, cùng khóa 'times', để trích xuất giá trị sai số chuẩn của hệ số góc từ mỗi mô hình.
  • Dùng thuộc tính .rsquared để lấy giá trị R-squared từ mỗi mô hình.
  • In ra se_1, rsquared_1, se_2, rsquared_2, và so sánh trực quan.