Testování hypotéz – rozdíl průměrů

Chceme otestovat hypotézu, že průměrné dary přijaté od skupin A a B se liší. V předchozím cvičení jsi se naučil/a generovat jedno permutované uspořádání dat. Nyní vygenerujeme nulové rozdělení rozdílu průměrů a vypočítáme p-hodnotu.

Pro nulové rozdělení nejprve vygenerujeme více permutovaných datových sad a pro každý případ uložíme rozdíl průměrů. Poté vypočítáme testovou statistiku jako rozdíl průměrů v původní datové sadě. Nakonec odhadneme p-hodnotu jako dvojnásobek podílu případů, kde je rozdíl větší nebo roven absolutní hodnotě testové statistiky (oboustranná hypotéza). P-hodnota nižší než např. 0,05 pak může potvrzovat statistickou významnost.

Vygeneruj více permutací donations_A a donations_B a výsledek přiřaď do perm.
Nastav samples jako rozdíl průměrů permuted_A_datasets a permuted_B_datasets. Používáme axis=1, abychom získali průměr pro každou datovou sadu zvlášť, nikoli celkový průměr.
Nastav test_stat jako rozdíl průměrů donations_A a donations_B.
Vypočítej p-hodnotu p_val jako dvojnásobek podílu hodnot samples, které jsou větší nebo rovny absolutní hodnotě test_stat.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení