1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Vizualizace testových statistik

V tomto cvičení se přiblížíš k nulové hypotéze tak, že porovnáš rozdělení testové statistiky získané dvěma různými způsoby.

Nejprve prozkoumáš dvě „populace" rozdělené podle raných a pozdních časů a vypočítáš rozdělení testové statistiky. Potom obě populace zamícháš, takže data přestanou být seřazena časově a každá skupina bude obsahovat mix raných i pozdních časů — a pak testovou statistiku spočítáš znovu.

Pro usnadnění práce jsou předem načteny dvě skupiny dob trvání: group_duration_short a group_duration_long, a také dvě funkce: shuffle_and_split() a plot_test_statistic().

Pokyny

100 XP
  • Pomocí np.random.choice() proveď resample pro group_duration_short a group_duration_long a odečtením resamplů vypočítej test_statistic_unshuffled.
  • Pomocí shuffle_and_split() aplikované na původní group_duration_short a group_duration_long (zadané v tomto pořadí) vytvoř dvě nové smíšené populace.
  • Proveď resample zamíchaných populací a odečtením resample_short od resample_long vypočítej novou hodnotu test_statistic_shuffled.
  • Pomocí plot_test_statistic() vykresli obě rozdělení testových statistik a vizuálně je porovnej.