Uji dua proporsi
Anda mungkin bertanya-tanya apakah besarnya biaya pengangkutan memengaruhi apakah suatu pengiriman terlambat atau tidak. Ingat bahwa pada himpunan data late_shipments, status keterlambatan pengiriman disimpan di kolom late. Biaya pengangkutan disimpan di kolom freight_cost_group, dengan kategori "expensive" dan "reasonable".
Hipotesis yang akan diuji, dengan "late" mewakili proporsi pengiriman terlambat untuk setiap grup, adalah
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats memuat taksiran proporsi populasi (proporsi sampel) untuk setiap freight_cost_group:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns memuat ukuran sampel untuk grup-grup ini:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas dan numpy telah diimpor dengan alias biasanya, dan norm tersedia dari scipy.stats.
Latihan ini adalah bagian dari kursus
Pengujian Hipotesis dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)