1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶ仮説検定

Connected

Bài tập

2つの比率の検定

運賃に支払った金額が配送の遅延に影響するかどうか、気になりませんか。late_shipments データセットでは、配送が遅れたかどうかは late 列に保存されています。運賃は freight_cost_group 列にあり、カテゴリは "expensive" と "reasonable" です。

ここで検定する仮説は、各グループの遅延配送の比率を "late" として、次のとおりです。

\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)

\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)

p_hats には、各 freight_cost_group の母比率の推定値(標本比率)が入っています。

freight_cost_group  late
expensive           Yes     0.082569
reasonable          Yes     0.035165
Name: late, dtype: float64

ns には、これらのグループの標本サイズが入っています。

freight_cost_group
expensive     545
reasonable    455
Name: late, dtype: int64

pandas と numpy は通常のエイリアスでインポート済みで、scipy.stats から norm が利用できます。

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • p_hats と ns からプールした標本比率 \(\hat{p}\) を計算します。

$$ \hat{p} = \frac{n_{\text{expensive}} \times \hat{p}_{\text{expensive}} + n_{\text{reasonable}} \times \hat{p}_{\text{reasonable}}}{n_{\text{expensive}} + n_{\text{reasonable}}} $$