Significancia de la diferencia de proporciones
Ir al trabajo en bici sigue siendo poco común, pero Washington, D. C., tiene una cuota nada desdeñable. Ha aumentado en más de 1 punto porcentual en los últimos años, pero ¿es un aumento estadísticamente significativo? En este ejercicio calcularás el error estándar de una proporción y, después, un estadístico Z de dos muestras para las proporciones.
La fórmula del error estándar (SE) de una proporción es:
$$SE_P = \frac{1}{N}\sqrt{SE_n^2 - P^2SE_N^2}$$
La fórmula del estadístico Z de dos muestras es:
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
El DataFrame dc está cargado. Contiene columnas (mostradas en la consola) con estimaciones (terminadas en "_est") y márgenes de error (terminados en "_moe") para el total de personas trabajadoras y quienes van en bici.
La función sqrt se ha importado del módulo numpy.
Este ejercicio forma parte del curso
Análisis de datos del Censo de EE. UU. con Python
Instrucciones del ejercicio
- Calcula
bike_sharedividiendo el número de ciclistas entre el número total de personas trabajadoras - Calcula el SE de la estimación de ciclistas y del total de personas trabajadoras dividiendo el MOE entre
Z_CRIT - Calcula el SE de las proporciones:
se_bikees el SE de la subpoblación \(SE_n\),bike_sharees la proporción \(P\) yse_totales el SE de la población \(SE_N\) - Calcula \(Z\): \(x_1\) y \(x_2\) son el
bike_shareen 2017 y 2011; \(SE_{x_1}\) y \(SE_{x_2}\) sonse_pen 2017 y 2011
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the critical Z score for 90% confidence
Z_CRIT = 1.645
# Calculate share of bike commuting
dc["bike_share"] = ____
# Calculate standard errors of the estimate from MOEs
dc["se_bike"] = ____
dc["se_total"] = ____
dc["se_p"] = sqrt(____**2 - ____**2 * ____**2)**0.5 / dc["total_est"]
# Calculate the two sample statistic between 2011 and 2017
Z = (dc[dc["year"] == 2017]["bike_share"] - ____) / \
sqrt(____**2 + ____**2)
print(Z_CRIT < Z)