1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kiểm định giả thuyết trong R

Connected

Bài tập

Kiểm định hai tỷ lệ

Bạn có thể tự hỏi liệu chi phí vận chuyển có ảnh hưởng đến việc lô hàng có bị giao trễ hay không. Nhắc lại rằng trong bộ dữ liệu late_shipments, trạng thái giao trễ được lưu ở cột late. Chi phí vận chuyển được lưu ở cột freight_cost_group với hai nhóm "expensive" và "reasonable".

Ta có thể đặt giả thuyết để kiểm định.

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats chứa ước lượng tỷ lệ tổng thể (tỷ lệ mẫu) cho hai nhóm "expensive" và "reasonable". ns chứa kích thước mẫu của các nhóm này.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tính tỷ lệ mẫu gộp, \(\hat{p}\), là trung bình của p_hats có trọng số theo ns. Dùng weighted.mean() hoặc tính theo công thức này.

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$