1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gândire statistică în Python (Partea 2)

Connected

exercițiu

Cât de des apar meciurile fără lovitură primită?

Numărul de meciuri jucate între fiecare meci fără lovitură primită (no-hitter) în era modernă (1901–2015) a Major League Baseball este stocat în array-ul nohitter_times.

Dacă presupunem că meciurile fără lovitură primită urmează un proces Poisson, atunci timpul dintre acestea urmează o distribuție exponențială. Așa cum ai văzut, distribuția exponențială are un singur parametru, pe care îl vom numi \(\tau\) – intervalul de timp tipic. Valoarea parametrului \(\tau\) care face ca distribuția exponențială să se potrivească cel mai bine datelor este timpul mediu al intervalului (unde timpul este măsurat în număr de meciuri) dintre meciurile fără lovitură primită.

Calculează valoarea acestui parametru din date. Apoi, folosește np.random.exponential() pentru a „recrea" istoria Major League Baseball, generând timpii dintre meciurile fără lovitură primită dintr-o distribuție exponențială cu \(\tau\)-ul găsit, și trasează histograma ca aproximare a funcției de densitate de probabilitate (PDF).

NumPy, pandas, matplotlib.pyplot și seaborn au fost importate pentru tine ca np, pd, plt și, respectiv, sns.

Instrucțiuni

100 XP
  • Inițializează generatorul de numere aleatoare cu 42.
  • Calculează timpul mediu (în număr de meciuri) dintre meciurile fără lovitură primită.
  • Generează 100.000 de eșantioane dintr-o distribuție exponențială cu parametrul calculat din media timpilor dintre meciurile fără lovitură primită.
  • Trasează PDF-ul teoretic folosind plt.hist(). Nu uita să folosești argumentele cheie bins=50, normed=True și histtype='step'. Asigură-te că etichetezi axele.
  • Afișează graficul.