1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Dwupróbkowy bootstrapowy test hipotezy dla różnicy średnich

Chcemy teraz przetestować hipotezę, że Żaba A i Żaba B mają tę samą średnią siłę uderzenia, niekoniecznie jednak ten sam rozkład – czego nie da się sprawdzić testem permutacyjnym.

Aby przeprowadzić dwupróbkowy test bootstrapowy, przesuwamy obie tablice tak, by miały tę samą średnią – symulujemy bowiem hipotezę, że ich średnie są w rzeczywistości równe. Następnie losujemy próbki bootstrapowe z przesuniętych tablic i obliczamy różnicę średnich. To właśnie jest jeden replikat bootstrapowy – generujemy ich wiele. Wartość p-value to ułamek replikatów, w których różnica średnich jest większa lub równa zaobserwowanej wartości.

Obiekty forces_concat i empirical_diff_means są już dostępne w twoim środowisku.

Instrukcje

100 XP
  • Oblicz średnią wszystkich sił (z forces_concat) za pomocą np.mean().
  • Wygeneruj przesunięte zbiory danych dla obu tablic – force_a i force_b – tak, aby średnia każdej z nich była równa średniej ze skonkatenowanej tablicy sił uderzenia.
  • Wygeneruj po 10 000 replikatów bootstrapowych średniej dla każdej z dwóch przesuniętych tablic.
  • Oblicz replikaty bootstrapowe różnicy średnich, odejmując replikaty przesuniętej siły uderzenia Żaby B od replikatów Żaby A.
  • Oblicz i wyświetl wartość p-value na podstawie uzyskanych replikatów bootstrapowych.