1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistical Thinking in Python (Part 2)

Connected

cvičení

Dvouvýběrový bootstrapový test hypotézy o rozdílu průměrů

Teď chceme otestovat hypotézu, že žába A a žába B mají stejnou střední hodnotu síly dopadu, ale nemusí mít stejné rozdělení – to pomocí permutačního testu zkoumat nelze.

Pro dvouvýběrový bootstrapový test posuneme obě pole tak, aby měla stejný průměr, protože simulujeme hypotézu, že jejich průměry jsou ve skutečnosti stejné. Z posunutých polí pak vytáhneme bootstrapové vzorky a vypočítáme rozdíl průměrů. To je jeden bootstrapový replikát – a takových vygenerujeme mnoho. P-hodnota je podíl replikátů, kde je rozdíl průměrů větší nebo roven pozorované hodnotě.

Objekty forces_concat a empirical_diff_means jsou už dostupné ve tvém pracovním prostředí.

Pokyny

100 XP
  • Pomocí np.mean() vypočítej průměr všech sil (z pole forces_concat).
  • Vytvoř posunuté datové sady pro obě pole – force_a i force_b – tak, aby průměr každého z nich odpovídal průměru zřetězeného pole sil dopadu.
  • Pro každé z posunutých polí vygeneruj 10 000 bootstrapových replikátů průměru.
  • Vypočítej bootstrapové replikáty rozdílu průměrů odečtením replikátů posunuté síly dopadu žáby B od replikátů žáby A.
  • Vypočítej a vypiš p-hodnotu z bootstrapových replikátů.