1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

Exercise

노히터는 얼마나 자주 일어날까요?

메이저리그 베이스볼의 현대(1901–2015)에서 각 노히터 사이에 치러진 경기 수는 배열 nohitter_times에 저장되어 있습니다.

노히터가 Poisson 과정으로 설명된다고 가정하면, 노히터 사이의 시간은 Exponential 분포를 따릅니다. 보셨듯이 Exponential 분포에는 하나의 매개변수가 있으며, 이를 전형적인 간격 시간인 $\tau\(라고 하겠습니다. 지수분포가 데이터와 가장 잘 맞도록 하는 매개변수 \)\tau$의 값은 노히터 사이의 평균 간격 시간(여기서 시간 단위는 경기 수)입니다.

데이터에서 이 매개변수 값을 계산하세요. 그런 다음 np.random.exponential()을 사용해, 구한 $\tau$를 갖는 지수분포에서 노히터 간격 시간을 추출하여 메이저리그의 “역사”를 반복하고, 히스토그램을 그려 PDF의 근사로 사용하세요.

NumPy, pandas, matplotlib.pyplot, seaborn은 각각 np, pd, plt, sns로 이미 임포트되어 있습니다.

Инструкции

100 XP
  • 난수 생성기의 시드를 42로 설정하세요.
  • 노히터 사이의 평균 시간(경기 수 단위)을 계산하세요.
  • 노히터 간격 시간의 평균에서 계산한 매개변수를 사용해 Exponential 분포에서 표본 100,000개를 추출하세요.
  • plt.hist()로 이론적 PDF를 그리세요. 키워드 인자 bins=50, normed=True, histtype='step'를 사용하세요. 축 라벨도 꼭 지정하세요.
  • 플롯을 표시하세요.