Belmont Stakes sonuçları Normal dağılıma uyuyor mu?
1926'dan beri Belmont Stakes, 3 yaşındaki safkan atların koştuğu 1,5 millik bir yarıştır. Secretariat 1973'te tarihin en hızlı Belmont Stakes derecesini koştu. En hızlı yıl 1973 olsa da, olağandışı derecede ıslak ve çamurlu koşullar nedeniyle 1970 en yavaştı. Bu iki aykırı değer veri kümesinden çıkarıldığında, Belmont kazananlarının sürelerinin ortalamasını ve standart sapmasını hesapla. Bu ortalama ve standart sapma ile rng.normal() fonksiyonunu kullanarak Normal dağılımdan örnekle ve bir KDA çiz. Üzerine Belmont kazanan sürelerinin EKKDA'sını bindir. Normal dağılıma yakın görünüyorlar mı?
Not: Justin, Belmont Stakes ile ilgili verileri Belmont Wikipedia sayfasından kazıdı.
Bu egzersiz
Python ile İstatistiksel Düşünme (Bölüm 1)
kursunun bir parçasıdırEgzersiz talimatları
- İki aykırı değer çıkarıldıktan sonra Belmont kazananlarının sürelerinin ortalamasını ve standart sapmasını hesapla. Bu veriler NumPy dizisi
belmont_no_outliersiçinde. rng.normal()kullanarak bu ortalama ve standart sapma ile Normal dağılımdan 10.000 örnek al.- Kuramsal örneklerin KDA'sını ve Belmont kazananlarının verisinin EKKDA'sını hesapla ve sonuçları sırasıyla
x_theor, y_theorvex, ydeğişkenlerine ata. - KDA ile EKKDA'yı çizdirmek, eksenlerini etiketlemek ve grafiği göstermek için Yanıtı Gönder düğmesine bas.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Compute mean and standard deviation: mu, sigma
# Sample out of a normal distribution with this mu and sigma: samples
# Get the CDF of the samples and of the data
# Plot the CDFs and show the plot
_ = plt.plot(x_theor, y_theor)
_ = plt.plot(x, y, marker='.', linestyle='none')
_ = plt.xlabel('Belmont winning time (sec.)')
_ = plt.ylabel('CDF')
plt.show()