Significância da Diferença de Estimativas
Um gráfico de linhas com barras de erro dá uma noção geral das tendências, mas as diferenças de um ano para o outro são estatisticamente significativas? Neste exercício, você vai determinar a significância das mudanças no preço mediano de imóveis na Filadélfia. Você vai avaliar as diferenças ano a ano entre 2011 e 2017.
A fórmula para a estatística Z de duas amostras é:
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
Um DataFrame philly está disponível com as colunas median_home_value, median_home_value_moe e year.
pandas foi importado como pd, e a função sqrt foi importada do módulo numpy.
Este exercício faz parte do curso
Analisando dados do Censo dos EUA em Python
Instruções do exercício
- Defina
x1como o valor mediano de imóvel do ano atual ex2como o valor mediano do ano anterior (ano atual menos 1) - Defina
se_x1como o MOE do valor mediano de imóvel do ano atual dividido porZ_CRIT, ese_x2como o mesmo cálculo para o ano anterior - Use o operador ternário do Python (
result1 if condition else result2) para retornar a string vazia se o valor absoluto dezfor maior queZ_CRIT, e caso contrário retornar `"not "
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
# Assign current and prior year's median home value to variables
x1 = int(philly[philly["year"] == ____]["median_home_value"])
x2 = int(____)
# Calculate standard error as 90% MOE / critical Z score
se_x1 = float(____)
se_x2 = float(____)
# Calculate two-sample z-statistic, output message if greater than critical Z score
z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
print(msg.format(year, ____, year - 1))