1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Testovací statistiky a velikost efektu

Jak lze zkoumat lineární vztahy pomocí bootstrap resamplingu? Zpět na stezku! Každá túra je zobrazena jako jeden bod a vidíme, že mezi celkovou ujetou vzdáleností a uplynulým časem existuje lineární vztah. Pokud budeme vzdálenost považovat za „efekt" uplynulého času, můžeme prozkoumat hlubší spojitost mezi lineární regresí a statistickou inferencí.

V tomto cvičení rozdělíš data do dvou populací neboli „kategorií": rané časy a pozdní časy. Pak se podíváš na rozdíly v celkové ujeté vzdálenosti v rámci každé populace. Tento rozdíl poslouží jako „testovací statistika" a jeho rozdělení otestuje vliv oddělení vzdáleností podle časů.

ch04_ex11_fig03.png

Pokyny

100 XP
  • Pomocí "logického indexování" v numpy, např. sample_distances[sample_times < 5], rozděl ukázkové hodnoty distances do populací raných a pozdních časů.
  • Pomocí np.random.choice() s replacement=True vytvoř resample pro každý ze dvou časových intervalů.
  • Vypočítej pole test_statistic jako resample_long - resample_short a pomocí np.mean() a np.std() zjisti a vypiš velikost efektu a nejistotu.
  • Vykresli rozdělení test_statistic pomocí předdefinované funkce fig = plot_test_statistic().