1. Learn
  2. /
  3. Kurser
  4. /
  5. Hypotestestning i Python

Connected

övning

Teststatistika för medelvärdesskillnad med två urval

Hypotestestet för att avgöra om det finns en skillnad mellan medelvärden i två populationer använder en annan typ av teststatistika än de z-värden du såg i kapitel 1. Den kallas "t" och beräknas utifrån tre värden från varje urval med följande formel.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

När du försöker förstå varför vissa leveranser är försenade kan du undra om vikten på leveranser som kom i tid är lägre än vikten på de försenade leveranserna. Datamängden late_shipments har delats upp i en "yes"-grupp, där late == "Yes", och en "no"-grupp, där late == "No". Leveransernas vikt anges i variabeln weight_kilograms.

Urvalsmedelvärdena för de två grupperna finns tillgängliga som xbar_no och xbar_yes. Urvalsstandardavvikelserna är s_no och s_yes. Urvalsstorlekarna är n_no och n_yes. numpy är också inläst som np.

Instruktioner

100 XP
  • Beräkna täljaren i \(t\)-teststatistikan.
  • Beräkna nämnaren i \(t\)-teststatistikan.
  • Använd dessa två tal för att beräkna \(t\)-teststatistikan.