1. Nauka
  2. /
  3. Kursy
  4. /
  5. Symulacje statystyczne w Pythonie

Connected

ćwiczenie

Testowanie hipotez – różnica średnich

Chcemy przetestować hipotezę, że istnieje różnica w średnich darowiznach otrzymanych z grup A i B. W poprzednim ćwiczeniu nauczyłeś(-aś) się generować jedną permutację danych. Teraz wygenerujemy rozkład zerowy różnicy średnich, a następnie obliczymy p-wartość.

Aby uzyskać rozkład zerowy, najpierw generujemy wiele permutowanych zbiorów danych i zapisujemy różnicę średnich dla każdego przypadku. Następnie obliczamy statystykę testową jako różnicę średnich na oryginalnym zbiorze danych. Na koniec szacujemy p-wartość, obliczając dwukrotność frakcji przypadków, w których różnica jest większa lub równa wartości bezwzględnej statystyki testowej (hipoteza dwustronna). P-wartość mniejsza niż np. 0,05 może świadczyć o istotności statystycznej.

Instrukcje

100 XP
  • Wygeneruj wiele permutacji donations_A i donations_B i przypisz wynik do perm.
  • Ustaw samples jako różnicę średnich zbiorów permuted_A_datasets i permuted_B_datasets. Użyj axis=1, aby uzyskać średnią dla każdego zbioru danych zamiast średniej globalnej.
  • Ustaw test_stat jako różnicę średnich donations_A i donations_B.
  • Oblicz p-wartość p_val jako dwukrotność frakcji wartości samples większych lub równych wartości bezwzględnej test_stat.