Teste de duas proporções
Você pode se perguntar se o valor pago pelo frete afeta o fato de a remessa estar ou não atrasada. Lembre-se de que no conjunto de dados late_shipments, o fato de a remessa estar ou não atrasada é armazenado na coluna late. Os custos de frete são armazenados na coluna freight_cost_group, e as categorias são "expensive" e "reasonable".
As hipóteses a serem testadas, com "late" correspondendo à proporção de remessas atrasadas nesse grupo, são
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats contém as estimativas das proporções da população (proporções amostrais) em cada freight_cost_group:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns contém os tamanhos das amostras desses grupos:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas e numpy foram importados com os nomes alternativos habituais, e norm foi disponibilizado a partir de scipy.stats.
Este exercício faz parte do curso
Teste de hipóteses em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)