1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 1)

Connected

ćwiczenie

Związek między rozkładem dwumianowym a rozkładem Poissona

Właśnie dowiedziałeś się, że rozkład Poissona jest granicą rozkładu dwumianowego dla rzadkich zdarzeń. Ma to sens, jeśli pomyślisz o opisach obu rozkładów. Wyobraź sobie, że co minutę przez godzinę przeprowadzasz próbę Bernoulliego, każdą z prawdopodobieństwem sukcesu 0,1. Wykonasz 60 prób, a liczba sukcesów ma rozkład dwumianowy – możemy się spodziewać około 6 sukcesów. To dokładnie odpowiada historii o rozkładzie Poissona omówionej w materiale wideo, gdzie witryna internetowa otrzymuje średnio 6 odwiedzin na godzinę. Rozkład Poissona ze współczynnikiem napływu równym \(np\) przybliża zatem rozkład dwumianowy dla \(n\) prób Bernoulliego z prawdopodobieństwem sukcesu \(p\) (przy dużym \(n\) i małym \(p\)). Co istotne, rozkład Poissona jest często prostszy w użyciu, ponieważ ma tylko jeden parametr – w odróżnieniu od dwóch parametrów rozkładu dwumianowego.

Przeanalizujmy oba rozkłady obliczeniowo. Obliczysz średnią i odchylenie standardowe próbek z rozkładu Poissona o współczynniku napływu równym 10. Następnie obliczysz średnią i odchylenie standardowe próbek z rozkładu dwumianowego z parametrami \(n\) i \(p\) takimi, że \(np = 10\).

Instrukcje

100 XP
  • Używając funkcji rng.poisson(), wylosuj 10000 próbek z rozkładu Poissona o średniej równej 10.
  • Utwórz listę wartości n i p do rozważenia dla rozkładu dwumianowego. Wybierz n = [20, 100, 1000] i p = [0.5, 0.1, 0.01], tak aby \(np\) zawsze wynosiło 10.
  • Używając rng.binomial() wewnątrz dostarczonej pętli for, wylosuj 10000 próbek z rozkładu dwumianowego dla każdej pary n, p i wydrukuj średnią oraz odchylenie standardowe próbek. Są 3 pary n, p: 20, 0.5, 100, 0.1 i 1000, 0.01. Dostęp do nich wewnątrz pętli uzyskasz jako n[i], p[i].