Seoptimal apa parameter ini?
Sekarang ambil sampel dari sebaran eksponensial dengan \(\tau\) dua kali lebih besar daripada \(\tau\) optimal. Lakukan lagi untuk \(\tau\) yang setengahnya. Buat CDF dari sampel-sampel ini dan tumpangtindihkan dengan data Anda. Anda akan melihat bahwa hasilnya tidak mereplikasi data sebaik sebelumnya. Dengan demikian, \(\tau\) yang Anda hitung dari rata-rata waktu jeda tanpa no-hitter adalah optimal karena paling baik mereplikasi data.
Catatan: Dalam latihan ini dan selanjutnya, generator bilangan acak sudah dipasang seed untuk Anda agar menghemat pengetikan.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Ambil
10000sampel dari sebaran Eksponensial dengan parameter \(\tau_{1/2}\) =tau/2. - Ambil
10000sampel dari sebaran Eksponensial dengan parameter \(\tau_{2}\) =2*tau. - Hasilkan CDF dari dua himpunan sampel ini menggunakan fungsi
ecdf()Anda. - Tambahkan kedua CDF ini sebagai garis pada plot Anda. Ini sudah dilakukan untuk Anda, jadi tekan kirim untuk melihat plot!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot the theoretical CDFs
plt.plot(x_theor, y_theor)
plt.plot(x, y, marker='.', linestyle='none')
plt.margins(0.02)
plt.xlabel('Games between no-hitters')
plt.ylabel('CDF')
# Take samples with half tau: samples_half
samples_half = ____
# Take samples with double tau: samples_double
samples_double = ____
# Generate CDFs from these samples
x_half, y_half = ____
x_double, y_double = ____
# Plot these CDFs as lines
_ = plt.plot(x_half, y_half)
_ = plt.plot(x_double, y_double)
# Show the plot
plt.show()