Keterkaitan antara distribusi Binomial dan Poisson
Anda baru saja mendengar bahwa distribusi Poisson merupakan batas dari distribusi Binomial untuk kejadian langka. Ini masuk akal jika Anda memikirkan ceritanya. Misalkan kita melakukan sebuah percobaan Bernoulli setiap menit selama satu jam, masing-masing dengan peluang sukses 0,1. Kita akan melakukan 60 percobaan, dan jumlah keberhasilan berdistribusi Binomial, dengan harapan sekitar 6 keberhasilan. Ini mirip dengan cerita Poisson yang dibahas dalam video, di mana rata-rata ada 6 kunjungan situs per jam. Jadi, distribusi Poisson dengan laju kedatangan sebesar \(np\) mendekati distribusi Binomial untuk \(n\) percobaan Bernoulli dengan peluang sukses \(p\) (dengan \(n\) besar dan \(p\) kecil). Yang penting, distribusi Poisson sering kali lebih sederhana untuk digunakan karena hanya memiliki satu parameter, bukan dua seperti pada distribusi Binomial.
Mari kita eksplorasi kedua distribusi ini secara komputasional. Anda akan menghitung mean dan simpangan baku dari sampel distribusi Poisson dengan laju kedatangan 10. Lalu, Anda akan menghitung mean dan simpangan baku dari sampel distribusi Binomial dengan parameter \(n\) dan \(p\) sedemikian sehingga \(np = 10\).
Latihan ini adalah bagian dari kursus
Berpikir Statistis dengan Python (Bagian 1)
Petunjuk latihan
- Menggunakan fungsi
rng.poisson(), ambil10000sampel dari distribusi Poisson dengan mean10. - Buat list nilai
ndanpyang akan digunakan untuk distribusi Binomial. Pilihn = [20, 100, 1000]danp = [0.5, 0.1, 0.01]sehingga \(np\) selalu 10. - Menggunakan
rng.binomial()di dalamforloop yang disediakan, ambil10000sampel dari distribusi Binomial untuk setiap pasangann, pdan cetak mean serta simpangan baku dari sampelnya. Ada 3 pasangann, p:20, 0.5,100, 0.1, dan1000, 0.01. Pasangan-pasangan ini dapat diakses di dalam loop sebagain[i], p[i].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Draw 10,000 samples out of Poisson distribution: samples_poisson
# Print the mean and standard deviation
print('Poisson: ', np.mean(samples_poisson),
np.std(samples_poisson))
# Specify values of n and p to consider for Binomial: n, p
# Draw 10,000 samples for each n,p pair: samples_binomial
for i in range(3):
samples_binomial = ____
# Print results
print('n =', n[i], 'Binom:', np.mean(samples_binomial),
np.std(samples_binomial))