1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tư duy Thống kê với Python (Phần 1)

Connected

Bài tập

Kết quả Belmont Stakes có phân phối Chuẩn không?

Từ năm 1926, Belmont Stakes là cuộc đua dài 1,5 mile dành cho ngựa thuần chủng 3 tuổi. Secretariat đã lập kỷ lục chạy nhanh nhất lịch sử Belmont Stakes vào năm 1973. Dù đó là năm nhanh nhất, năm 1970 lại chậm nhất do điều kiện đường đua ướt và lầy bất thường. Khi loại bỏ hai điểm ngoại lai này khỏi tập dữ liệu, hãy tính trung bình và độ lệch chuẩn thời gian về đích của các quán quân Belmont. Lấy mẫu từ phân phối Chuẩn với trung bình và độ lệch chuẩn này bằng hàm rng.normal() và vẽ CDF. Chồng thêm ECDF từ thời gian thắng cuộc của Belmont. Các kết quả này có gần với phân phối Chuẩn không?

Lưu ý: Justin đã thu thập dữ liệu về Belmont Stakes từ trang Wikipedia của Belmont.

Hướng dẫn

100 XP
  • Tính trung bình và độ lệch chuẩn thời gian về đích của các quán quân Belmont sau khi loại bỏ hai điểm ngoại lai. Mảng NumPy belmont_no_outliers chứa các dữ liệu này.
  • Lấy 10.000 mẫu từ một phân phối Chuẩn với trung bình và độ lệch chuẩn này bằng rng.normal().
  • Tính CDF của các mẫu lý thuyết và ECDF của dữ liệu quán quân Belmont, lần lượt gán kết quả cho x_theor, y_theor và x, y.
  • Nhấn Gửi để vẽ CDF của mẫu của bạn cùng với ECDF, đặt nhãn cho trục và hiển thị biểu đồ.