Keterkaitan antara distribusi Binomial dan Poisson

Anda baru saja mendengar bahwa distribusi Poisson merupakan batas dari distribusi Binomial untuk kejadian langka. Ini masuk akal jika Anda memikirkan ceritanya. Misalkan kita melakukan sebuah percobaan Bernoulli setiap menit selama satu jam, masing-masing dengan peluang sukses 0,1. Kita akan melakukan 60 percobaan, dan jumlah keberhasilan berdistribusi Binomial, dengan harapan sekitar 6 keberhasilan. Ini mirip dengan cerita Poisson yang dibahas dalam video, di mana rata-rata ada 6 kunjungan situs per jam. Jadi, distribusi Poisson dengan laju kedatangan sebesar \(np\) mendekati distribusi Binomial untuk \(n\) percobaan Bernoulli dengan peluang sukses \(p\) (dengan \(n\) besar dan \(p\) kecil). Yang penting, distribusi Poisson sering kali lebih sederhana untuk digunakan karena hanya memiliki satu parameter, bukan dua seperti pada distribusi Binomial.

Mari kita eksplorasi kedua distribusi ini secara komputasional. Anda akan menghitung mean dan simpangan baku dari sampel distribusi Poisson dengan laju kedatangan 10. Lalu, Anda akan menghitung mean dan simpangan baku dari sampel distribusi Binomial dengan parameter \(n\) dan \(p\) sedemikian sehingga \(np = 10\).

Latihan ini merupakan bagian dari kursus

Berpikir Statistis dengan Python (Bagian 1)

Lihat Kursus

Instruksi latihan

Menggunakan fungsi rng.poisson(), ambil 10000 sampel dari distribusi Poisson dengan mean 10.
Buat list nilai n dan p yang akan digunakan untuk distribusi Binomial. Pilih n = [20, 100, 1000] dan p = [0.5, 0.1, 0.01] sehingga \(np\) selalu 10.
Menggunakan rng.binomial() di dalam for loop yang disediakan, ambil 10000 sampel dari distribusi Binomial untuk setiap pasangan n, p dan cetak mean serta simpangan baku dari sampelnya. Ada 3 pasangan n, p: 20, 0.5, 100, 0.1, dan 1000, 0.01. Pasangan-pasangan ini dapat diakses di dalam loop sebagai n[i], p[i].

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Draw 10,000 samples out of Poisson distribution: samples_poisson


# Print the mean and standard deviation
print('Poisson:     ', np.mean(samples_poisson),
                       np.std(samples_poisson))

# Specify values of n and p to consider for Binomial: n, p



# Draw 10,000 samples for each n,p pair: samples_binomial
for i in range(3):
    samples_binomial = ____

    # Print results
    print('n =', n[i], 'Binom:', np.mean(samples_binomial),
                                 np.std(samples_binomial))

Edit dan Jalankan Kode