1. Nauka
  2. /
  3. Kursy
  4. /
  5. Testowanie hipotez w Pythonie

Connected

ćwiczenie

Test dwóch proporcji

Zastanów się, czy koszt frachtu ma wpływ na to, czy przesyłka dotarła z opóźnieniem. Przypomnij sobie, że w zbiorze danych late_shipments informacja o opóźnieniu jest przechowywana w kolumnie late. Koszty frachtu znajdują się w kolumnie freight_cost_group, a kategorie to "expensive" i "reasonable".

Hipotezy do przetestowania – gdzie "late" oznacza proporcję opóźnionych przesyłek w danej grupie – są następujące:

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats zawiera oszacowania proporcji populacji (proporcje próbkowe) dla każdej grupy freight_cost_group:

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns zawiera liczebności próbek dla tych grup:

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas i numpy zostały zaimportowane pod zwykłymi aliasami, a norm jest dostępne z scipy.stats.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Oblicz łączną proporcję próbkową, \(\hat{p}\), na podstawie p_hats i ns.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$