1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Statystyki testowe i wielkość efektu

Jak można badać zależności liniowe za pomocą bootstrap resamplingu? Wracamy na szlak! Każda wycieczka jest reprezentowana jako jeden punkt – widać wyraźną zależność liniową między całkowitym dystansem a upływem czasu. Jeśli potraktujemy przebyty dystans jako „efekt" czasu, możemy zbadać głębsze powiązanie między regresją liniową a wnioskowaniem statystycznym.

W tym ćwiczeniu podzielisz dane na dwie populacje, czyli „kategorie": wczesne czasy i późne czasy. Następnie przyjrzysz się różnicom całkowitego dystansu w obrębie każdej populacji. Ta różnica posłuży jako „statystyka testowa", a jej rozkład pozwoli ocenić efekt podziału dystansów według czasu.

ch04_ex11_fig03.png

Instrukcje

100 XP
  • Użyj „indeksowania logicznego" numpy, np. sample_distances[sample_times < 5], aby podzielić distances na populacje wczesnych i późnych czasów.
  • Użyj np.random.choice() z replacement=True, aby utworzyć resample dla każdego z dwóch przedziałów czasowych.
  • Oblicz tablicę test_statistic jako resample_long - resample_short, a następnie wyznacz i wyświetl wielkość efektu oraz niepewność za pomocą np.mean() i np.std().
  • Wyrysuj rozkład test_statistic, używając predefiniowanej funkcji fig = plot_test_statistic().