1. Learn
  2. /
  3. Курси
  4. /
  5. Тестування гіпотез у Python

Connected

вправа

Перевірка двох часток

Можна поцікавитися, чи впливає сума, сплачена за фрахт, на те, чи було відвантаження запізнілим. Нагадаємо: у наборі даних late_shipments інформація про те, чи було відвантаження пізнім, зберігається в стовпці late. Вартість фрахту зберігається в стовпці freight_cost_group, а категорії — "expensive" і "reasonable".

Гіпотези для перевірки, де "late" відповідає частці запізнілих відвантажень для цієї групи, такі:

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats містить оцінки часток у генеральній сукупності (вибіркові частки) для кожної freight_cost_group:

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns містить обсяги вибірок для цих груп:

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas і numpy імпортовано під звичними псевдонімами, а norm доступна з scipy.stats.

Інструкції 1/4

undefined XP
    1
    2
    3
    4
  • Обчисліть об'єднану вибіркову частку, \(\hat{p}\), з p_hats і ns.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$