MulaiMulai sekarang secara gratis

Apakah hasil Belmont Stakes bersebaran Normal?

Sejak 1926, Belmont Stakes adalah lomba sepanjang 1,5 mil untuk kuda thoroughbred berusia 3 tahun. Secretariat mencatat waktu tercepat dalam sejarah Belmont Stakes pada tahun 1973. Meskipun itu tahun tercepat, tahun 1970 adalah yang paling lambat karena kondisi yang sangat basah dan becek. Dengan dua pencilan ini dihapus dari himpunan data, hitung rata-rata dan simpangan baku waktu para pemenang Belmont. Ambil sampel dari sebaran Normal dengan rata-rata dan simpangan baku ini menggunakan fungsi rng.normal() dan plot sebuah CDF. Tumpangtindihkan ECDF dari waktu pemenang Belmont. Apakah ini mendekati sebaran Normal?

Catatan: Justin mengikis data terkait Belmont Stakes dari halaman Wikipedia Belmont.

Latihan ini adalah bagian dari kursus

Berpikir Statistis dengan Python (Bagian 1)

Lihat Kursus

Petunjuk latihan

  • Hitung rata-rata dan simpangan baku waktu pemenang Belmont dengan dua pencilan dihapus. Array NumPy belmont_no_outliers berisi data ini.
  • Ambil 10.000 sampel dari sebaran Normal dengan rata-rata dan simpangan baku tersebut menggunakan rng.normal().
  • Hitung CDF dari sampel teoretis dan ECDF dari data pemenang Belmont, dan tetapkan hasilnya masing-masing ke x_theor, y_theor serta x, y.
  • Tekan Kirim untuk memplot CDF dari sampel Anda bersama ECDF, beri label sumbu, dan tampilkan plot.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Compute mean and standard deviation: mu, sigma



# Sample out of a normal distribution with this mu and sigma: samples


# Get the CDF of the samples and of the data



# Plot the CDFs and show the plot
_ = plt.plot(x_theor, y_theor)
_ = plt.plot(x, y, marker='.', linestyle='none')
_ = plt.xlabel('Belmont winning time (sec.)')
_ = plt.ylabel('CDF')
plt.show()
Edit dan Jalankan Kode