ComeçarComece de graça

Significância da Diferença de Estimativas

Um gráfico de linhas com barras de erro dá uma noção geral das tendências, mas as diferenças de um ano para o outro são estatisticamente significativas? Neste exercício, você vai determinar a significância das mudanças no preço mediano de imóveis na Filadélfia. Você vai avaliar as diferenças ano a ano entre 2011 e 2017.

A fórmula para a estatística Z de duas amostras é:

$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$

Um DataFrame philly está disponível com as colunas median_home_value, median_home_value_moe e year.

pandas foi importado como pd, e a função sqrt foi importada do módulo numpy.

Este exercício faz parte do curso

Analisando dados do Censo dos EUA em Python

Ver curso

Instruções do exercício

  • Defina x1 como o valor mediano de imóvel do ano atual e x2 como o valor mediano do ano anterior (ano atual menos 1)
  • Defina se_x1 como o MOE do valor mediano de imóvel do ano atual dividido por Z_CRIT, e se_x2 como o mesmo cálculo para o ano anterior
  • Use o operador ternário do Python (result1 if condition else result2) para retornar a string vazia se o valor absoluto de z for maior que Z_CRIT, e caso contrário retornar `"not "

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
    # Assign current and prior year's median home value to variables
    x1 = int(philly[philly["year"] == ____]["median_home_value"])
    x2 = int(____)
    
    # Calculate standard error as 90% MOE / critical Z score
    se_x1 = float(____)
    se_x2 = float(____)
    
    # Calculate two-sample z-statistic, output message if greater than critical Z score
    z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
    print(msg.format(year, ____, year - 1))
Editar e executar o código