1. Learn
  2. /
  3. Courses
  4. /
  5. Myślenie statystyczne w Pythonie (część 1)

Connected

Exercise

Czy wyniki wyścigu Belmont Stakes mają rozkład normalny?

Od 1926 roku wyścig Belmont Stakes to bieg na dystansie 1,5 mili, w którym startują 3-letnie konie czystej krwi. Secretariat ustanowił najlepszy wynik w historii tego wyścigu w 1973 roku. Z kolei rok 1970 przyniósł najgorszy czas – z powodu wyjątkowo mokrej i trudnej nawierzchni. Po usunięciu tych dwóch wartości odstających ze zbioru danych oblicz średnią i odchylenie standardowe czasów zwycięzców. Pobierz próbkę z rozkładu normalnego o tej średniej i tym odchyleniu standardowym, korzystając z funkcji rng.normal(), i narysuj wykres CDF. Nałóż na niego ECDF z czasów zwycięskich. Czy dane są bliskie rozkładowi normalnemu?

Uwaga: Justin zebrał dane dotyczące wyścigu Belmont Stakes ze strony Wikipedii poświęconej temu wyścigowi.

Instructions

100 XP
  • Oblicz średnią i odchylenie standardowe czasów zwycięzców wyścigu Belmont z usuniętymi dwiema wartościami odstającymi. Dane te zawiera tablica NumPy belmont_no_outliers.
  • Pobierz 10 000 próbek z rozkładu normalnego o tej średniej i tym odchyleniu standardowym, używając funkcji rng.normal().
  • Oblicz CDF próbek teoretycznych i ECDF danych zwycięzców wyścigu Belmont, przypisując wyniki odpowiednio do x_theor, y_theor oraz x, y.
  • Kliknij Prześlij odpowiedź, aby narysować wykres CDF próbek wraz z ECDF, oznaczyć osie i wyświetlić wykres.