Testowanie hipotez – różnica średnich

Chcemy przetestować hipotezę, że istnieje różnica w średnich darowiznach otrzymanych z grup A i B. W poprzednim ćwiczeniu nauczyłeś(-aś) się generować jedną permutację danych. Teraz wygenerujemy rozkład zerowy różnicy średnich, a następnie obliczymy p-wartość.

Aby uzyskać rozkład zerowy, najpierw generujemy wiele permutowanych zbiorów danych i zapisujemy różnicę średnich dla każdego przypadku. Następnie obliczamy statystykę testową jako różnicę średnich na oryginalnym zbiorze danych. Na koniec szacujemy p-wartość, obliczając dwukrotność frakcji przypadków, w których różnica jest większa lub równa wartości bezwzględnej statystyki testowej (hipoteza dwustronna). P-wartość mniejsza niż np. 0,05 może świadczyć o istotności statystycznej.

Wygeneruj wiele permutacji donations_A i donations_B i przypisz wynik do perm.
Ustaw samples jako różnicę średnich zbiorów permuted_A_datasets i permuted_B_datasets. Użyj axis=1, aby uzyskać średnią dla każdego zbioru danych zamiast średniej globalnej.
Ustaw test_stat jako różnicę średnich donations_A i donations_B.
Oblicz p-wartość p_val jako dwukrotność frakcji wartości samples większych lub równych wartości bezwzględnej test_stat.

ćwiczenie

Testowanie hipotez – różnica średnich

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie