1. Learn
  2. /
  3. Курси
  4. /
  5. Перевірка гіпотез у R

Connected

вправа

Тест двох часток

Можливо, ви замислюєтеся, чи впливає сума, сплачена за перевезення, на те, чи було відвантаження пізнім. Нагадаємо, що в наборі даних late_shipments факт запізнення відвантаження зберігається в стовпці late. Витрати на перевезення зберігаються в стовпці freight_cost_group, а категорії — "expensive" і "reasonable".

Можемо сформулювати гіпотези для перевірки.

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats містить оцінки часток у генеральній сукупності (вибіркові частки) для груп "expensive" і "reasonable". ns містить обсяги вибірок для цих груп.

Інструкції 1/4

undefined XP
    1
    2
    3
    4
  • Обчисліть об'єднану вибіркову частку, \(\hat{p}\), як середнє p_hats, зважене на ns. Скористайтеся weighted.mean() або арифметикою за цією формулою.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$