1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

데이터가 우리의 가설을 따르나요?

무안타 경기(no-hitter)를 지수(Exponential) 분포로 모델링했어요. 실제 데이터의 ECDF를 만든 뒤, 이론적 CDF와 데이터를 통해 얻은 ECDF를 겹쳐 보세요. 이렇게 하면 지수 분포가 관측된 데이터를 잘 설명하는지 확인할 수 있어요.

ECDF를 계산하기 위해 이전 강의에서 만든 함수와, 이를 시각화하는 코드를 다시 참고하면 도움이 됩니다.

지침

100 XP
  • 무안타 경기 사이의 실제 시간(nohitter_times)으로 ECDF를 계산하세요. 프리퀄 강의에서 작성한 ecdf() 함수를 사용합니다.
  • 이전 연습 문제에서 얻은 이론적 표본(inter_nohitter_time)으로 CDF를 만드세요.
  • plt.plot()으로 x_theor와 y_theor를 선으로 그리세요. 그런 다음 실제 데이터의 ECDF인 x와 y를 점으로 겹쳐 그립니다. 이를 위해 plt.plot()에서 x, y와 함께 marker = '.', linestyle = 'none' 키워드 인자를 지정하세요.
  • 플롯에 2% 여백을 설정하세요.
  • 플롯을 표시하세요.