1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v R

Connected

Cvičení

Test dvou proporcí

Možná tě zajímá, jestli výše nákladů na přepravu ovlivňuje, zda zásilka dorazila pozdě. Připomeň si, že v datasetu late_shipments je informace o tom, zda byla zásilka opožděná, uložena ve sloupci late. Náklady na přepravu jsou ve sloupci freight_cost_group s kategoriemi "expensive" a "reasonable".

Můžeme si stanovit hypotézy k otestování.

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats obsahuje odhady populačních proporcí (výběrové proporce) pro skupiny "expensive" a "reasonable". ns obsahuje velikosti výběrů pro tyto skupiny.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vypočítej sdruženou výběrovou proporci \(\hat{p}\) jako průměr hodnot p_hats vážený hodnotami ns. Použij weighted.mean() nebo aritmetiku podle tohoto vzorce.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$