1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v Pythonu

Connected

cvičení

Testovací statistika pro test dvou výběrových průměrů

Hypotézový test pro zjištění, zda existuje rozdíl mezi průměry dvou populací, používá jiný typ testovací statistiky než z-skóre z 1. kapitoly. Říká se jí „t" a lze ji vypočítat ze tří hodnot každého výběru pomocí tohoto vzorce.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

Při snaze zjistit, proč jsou některé zásilky opožděné, tě možná napadne otázka, zda hmotnost zásilek doručených včas je nižší než hmotnost zásilek, které se opozdily. Dataset late_shipments byl rozdělen do skupiny „yes", kde late == "Yes", a skupiny „no", kde late == "No". Hmotnost zásilky je uvedena v proměnné weight_kilograms.

Výběrové průměry obou skupin jsou dostupné jako xbar_no a xbar_yes. Výběrové směrodatné odchylky jsou s_no a s_yes. Velikosti výběrů jsou n_no a n_yes. K dispozici máš také knihovnu numpy načtenou jako np.

Pokyny

100 XP
  • Vypočítej čitatel testovací statistiky \(t\).
  • Vypočítej jmenovatele testovací statistiky \(t\).
  • Z těchto dvou čísel vypočítej testovací statistiku \(t\).