Significancia de la diferencia de proporciones

Ir al trabajo en bici sigue siendo poco común, pero Washington, D. C., tiene una cuota nada desdeñable. Ha aumentado en más de 1 punto porcentual en los últimos años, pero ¿es un aumento estadísticamente significativo? En este ejercicio calcularás el error estándar de una proporción y, después, un estadístico Z de dos muestras para las proporciones.

La fórmula del error estándar (SE) de una proporción es:

$$SE_P = \frac{1}{N}\sqrt{SE_n^2 - P^2SE_N^2}$$

La fórmula del estadístico Z de dos muestras es:

$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$

El DataFrame dc está cargado. Contiene columnas (mostradas en la consola) con estimaciones (terminadas en "_est") y márgenes de error (terminados en "_moe") para el total de personas trabajadoras y quienes van en bici.

La función sqrt se ha importado del módulo numpy.

Este ejercicio forma parte del curso

Análisis de datos del Censo de EE. UU. con Python

Ver curso

Instrucciones del ejercicio

Calcula bike_share dividiendo el número de ciclistas entre el número total de personas trabajadoras
Calcula el SE de la estimación de ciclistas y del total de personas trabajadoras dividiendo el MOE entre Z_CRIT
Calcula el SE de las proporciones: se_bike es el SE de la subpoblación $SE_n$, bike_share es la proporción $P$ y se_total es el SE de la población $SE_N$
Calcula $Z$: $x_1$ y $x_2$ son el bike_share en 2017 y 2011; $SE_{x_1}$ y $SE_{x_2}$ son se_p en 2017 y 2011

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set the critical Z score for 90% confidence
Z_CRIT = 1.645

# Calculate share of bike commuting
dc["bike_share"] = ____

# Calculate standard errors of the estimate from MOEs
dc["se_bike"] = ____
dc["se_total"] = ____
dc["se_p"] = sqrt(____**2 - ____**2 * ____**2)**0.5 / dc["total_est"]

# Calculate the two sample statistic between 2011 and 2017
Z = (dc[dc["year"] == 2017]["bike_share"] - ____) / \
    sqrt(____**2 + ____**2)
print(Z_CRIT < Z)

Editar y ejecutar código