Significancia de la diferencia de estimaciones
Un gráfico de líneas con barras de error te da una idea aproximada de las tendencias, pero ¿las diferencias de un año a otro son estadísticamente significativas? En este ejercicio, determinarás la significancia de los cambios en el precio mediano de la vivienda en Filadelfia. Evaluarás las diferencias año a año entre 2011 y 2017.
La fórmula para la estadística Z de dos muestras es:
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
Tienes disponible un DataFrame philly con las columnas median_home_value, median_home_value_moe y year.
pandas está importado como pd, y la función sqrt se ha importado del módulo numpy.
Este ejercicio forma parte del curso
Análisis de datos del Censo de EE. UU. con Python
Instrucciones del ejercicio
- Define
x1como el valor mediano de la vivienda del año actual yx2como el valor mediano de la vivienda del año previo (año actual menos 1) - Define
se_x1como el MOE del valor mediano de la vivienda del año actual dividido porZ_CRIT, yse_x2como el mismo cálculo para el año previo - Usa el operador ternario de Python (
result1 if condition else result2) para devolver la cadena vacía si el valor absoluto dezes mayor queZ_CRIT, y en caso contrario devolver `"not "
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
# Assign current and prior year's median home value to variables
x1 = int(philly[philly["year"] == ____]["median_home_value"])
x2 = int(____)
# Calculate standard error as 90% MOE / critical Z score
se_x1 = float(____)
se_x2 = float(____)
# Calculate two-sample z-statistic, output message if greater than critical Z score
z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
print(msg.format(year, ____, year - 1))