1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Vizualizace p-hodnoty

V tomto cvičení vizualizuješ p-hodnotu – tedy pravděpodobnost, že efekt (neboli „rychlost"), který jsme odhadli, vznikl náhodnou variací ve vzorku. Tvým cílem je znázornit ji jako podíl bodů v distribuci zamíchaných testovacích statistik, které leží napravo od průměru testovací statistiky („velikost efektu") vypočítaného z nezamíchaných vzorků.

Aby ses mohl/a rovnou pustit do práce, máš předem načteny group_duration_short a group_duration_long a funkce compute_test_statistic(), shuffle_and_split() a plot_test_statistic_effect()

Pokyny

100 XP
  • Pomocí compute_test_statistic() získej test_statistic_unshuffled z group_duration_short a group_duration_long; pak vypočítej velikost efektu pomocí np.mean().
  • Pomocí shuffle_and_split() vytvoř shuffle_half1 a shuffle_half2 a pomocí compute_test_statistic() vypočítej test_statistic_shuffled.
  • Vytvoř booleovskou masku condition pro hodnoty test_statistic_shuffled, které jsou větší nebo rovny effect_size, a tuto masku pak použij k výpočtu p_value.
  • Vypiš p_value a vykresli obě testovací statistiky pomocí plot_test_statistic_effect().