Prueba de dos proporciones
Tal vez te preguntes si el importe pagado por el transporte influye o no en el retraso del envío. Recuerda que, en el conjunto de datos late_shipments
, se indicaba en la columna late
si el envío se había retrasado o no. Los gastos de transporte se indican en la columna freight_cost_group
, y las categorías son "expensive"
y "reasonable"
.
Las hipótesis que deben probarse, con "late"
correspondiendo a la proporción de envíos retrasados para ese grupo, son:
\(H_{0}\): \(late_{\text{expensive}} - late_{\text{reasonable}} = 0\)
\(H_{A}\): \(late_{\text{expensive}} - late_{\text{reasonable}} > 0\)
p_hats
contiene las estimaciones de las proporciones de población (proporciones de muestra) para cada freight_cost_group
:
freight_cost_group late
expensive Yes 0.082569
reasonable Yes 0.035165
Name: late, dtype: float64
ns
contiene los tamaños de muestra de estos grupos:
freight_cost_group
expensive 545
reasonable 455
Name: late, dtype: int64
pandas
y numpy
se han importado con sus alias habituales, y norm
está disponible en scipy.stats
.
Este ejercicio forma parte del curso
Pruebas de hipótesis en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the pooled estimate of the population proportion
p_hat = ____
# Print the result
print(p_hat)