1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Zobecněné lineární modely v Pythonu

Connected

cvičení

Výpočet očekávaného počtu výskytů

V předchozích cvičeních jsi vypočítal/a střední hodnotu a rozptyl dat z datasetu crab a zjistil/a, že si nejsou rovny. V tomto cvičení si vyzkoušíš další analýzu overdisperse: pomocí již vypočítané střední hodnoty určíš očekávaný počet výskytů pro konkrétní hodnotu počtu, například nulový počet. Jinými slovy – kolik satelitů s hodnotou nula bychom měli v daném vzorku očekávat, vezmeme-li v úvahu vypočítanou výběrovou střední hodnotu.

Vzpomeň si na graf z datasetu crab, kde si lze všimnout velkého množství nulových hodnot.

Pro výpočet očekávaného počtu výskytů na základě daného parametru lze použít Poissonovo rozdělení dané vzorcem

$$ P(y)=\frac{\lambda^ye^{-\lambda}}{y!} $$

Dataset crab a vypočítaná střední hodnota sat_mean jsou předem načteny v pracovním prostředí.

Pokyny

100 XP
  • Pomocí vypočítané střední hodnoty sat_mean a nulového počtu \(y = 0\) vypočítej očekávaný počet nulových výskytů. Použij funkci factorial() z knihovny math.
  • Pomocí funkce sum() spočítej počet pozorování s nulovým počtem v proměnné sat a pomocí funkce len() zjisti celkový počet pozorování ve vzorku.
  • Vypiš podíl skutečných nulových pozorování a celkového počtu pozorování.