1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 하는 Statistical Thinking (파트 1)

Connected

Exercise

Belmont Stakes 결과는 정규분포를 따르나요?

1926년부터 Belmont Stakes는 3세 서러브레드 말들이 1.5마일을 달리는 경주입니다. 1973년에 Secretariat이 역사상 가장 빠른 기록을 세웠어요. 가장 빨랐던 해가 있는가 하면, 1970년은 이례적으로 비가 많이 와서 주로가 질척거려 가장 느렸습니다. 이 두 개의 이상치를 데이터에서 제거한 뒤, Belmont 우승마들의 기록(시간)의 평균과 표준편차를 구하세요. 이 평균과 표준편차를 사용해 rng.normal() 함수로 정규분포에서 표본을 추출하고 CDF를 그리세요. 그 위에 Belmont 우승 기록의 ECDF를 겹쳐 그려 보세요. 정규분포에 가깝다고 볼 수 있을까요?

참고: Justin은 Belmont Stakes 관련 데이터를 Belmont 위키피디아 페이지에서 스크레이핑했습니다.

Инструкции

100 XP
  • 두 개의 이상치를 제거한 Belmont 우승 기록의 평균과 표준편차를 계산하세요. NumPy 배열 belmont_no_outliers에 데이터가 들어 있어요.
  • rng.normal()을 사용해 이 평균과 표준편차로부터 정규분포에서 표본 10,000개를 추출하세요.
  • 이론적 표본의 CDF와 Belmont 우승 기록의 ECDF를 계산해 각각 x_theor, y_theor와 x, y에 저장하세요.
  • Submit을 눌러 표본의 CDF와 ECDF를 함께 그린 뒤, 축에 라벨을 붙이고 플롯을 표시하세요.