1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistické simulace v Pythonu

Connected

cvičení

Testování hypotéz – rozdíl průměrů

Chceme otestovat hypotézu, že průměrné dary přijaté od skupin A a B se liší. V předchozím cvičení jsi se naučil/a generovat jedno permutované uspořádání dat. Nyní vygenerujeme nulové rozdělení rozdílu průměrů a vypočítáme p-hodnotu.

Pro nulové rozdělení nejprve vygenerujeme více permutovaných datových sad a pro každý případ uložíme rozdíl průměrů. Poté vypočítáme testovou statistiku jako rozdíl průměrů v původní datové sadě. Nakonec odhadneme p-hodnotu jako dvojnásobek podílu případů, kde je rozdíl větší nebo roven absolutní hodnotě testové statistiky (oboustranná hypotéza). P-hodnota nižší než např. 0,05 pak může potvrzovat statistickou významnost.

Pokyny

100 XP
  • Vygeneruj více permutací donations_A a donations_B a výsledek přiřaď do perm.
  • Nastav samples jako rozdíl průměrů permuted_A_datasets a permuted_B_datasets. Používáme axis=1, abychom získali průměr pro každou datovou sadu zvlášť, nikoli celkový průměr.
  • Nastav test_stat jako rozdíl průměrů donations_A a donations_B.
  • Vypočítej p-hodnotu p_val jako dvojnásobek podílu hodnot samples, které jsou větší nebo rovny absolutní hodnotě test_stat.