1. 학습
  2. /
  3. 강의
  4. /
  5. Nhập môn Mô hình tuyến tính với Python

Connected

연습 문제

Ước lượng tốc độ và khoảng tin cậy

Hãy tiếp tục xem dữ liệu leo núi ở Vườn quốc gia. Lưu ý rằng một số quãng đường có giá trị âm vì họ đi ngược hướng so với điểm đầu lối mòn; dữ liệu khá lẫn lộn nên chúng ta sẽ chỉ tập trung vào xu hướng tổng thể.

Trong bài này, mục tiêu của bạn là dùng phương pháp boot-strap resampling để tìm phân phối các giá trị tốc độ cho một mô hình tuyến tính, rồi từ phân phối đó tính ước lượng tốt nhất cho tốc độ và khoảng tin cậy 90% của ước lượng đó. Ở đây, tốc độ chính là tham số hệ số góc (slope) từ mô hình hồi quy tuyến tính dùng để khớp quãng đường theo thời gian.

Để bạn bắt đầu, chúng tôi đã nạp sẵn dữ liệu distance và time, cùng với hàm least_squares() đã định nghĩa sẵn để tính giá trị tốc độ cho từng mẫu bootstrap.

지침

100 XP
  • Dùng np.random.choice() để rút sample_inds từ population_inds, giữ nguyên cặp ghép distance-time của từng điểm dữ liệu.
  • Để giữ thứ tự thời gian, gọi .sort() trên sample_inds, rồi dùng sample_inds để đánh chỉ mục distances và times.
  • Dùng least_squares(times, distances) để tính các tham số mô hình tuyến tính và lưu a1 vào resample_speeds.
  • Áp dụng np.mean() và np.percentiles() cho resample_speeds để tính tốc độ và khoảng tin cậy ci_90, rồi in cả hai.