Significativité de la différence des estimations
Un graphique en courbes avec barres d’erreur donne une idée générale des tendances, mais les différences d’une année à l’autre sont‑elles statistiquement significatives ? Dans cet exercice, vous allez déterminer la significativité de l’évolution du prix médian des logements à Philadelphie. Vous évaluerez les différences d’une année à l’autre entre 2011 et 2017.
La formule de la statistique Z à deux échantillons est :
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
Un DataFrame philly est disponible avec les colonnes median_home_value, median_home_value_moe et year.
pandas est importé sous le nom pd, et la fonction sqrt a été importée depuis le module numpy.
Cet exercice fait partie du cours
Analyzing US Census Data in Python
Instructions
- Définissez
x1sur la valeur médiane des logements de l’année en cours, etx2sur la valeur médiane de l’année précédente (année en cours moins 1) - Définissez
se_x1sur la MOE de la valeur médiane des logements de l’année en cours divisée parZ_CRIT, etse_x2sur le même calcul pour l’année précédente - Utilisez l’opérateur ternaire de Python (
result1 if condition else result2) pour renvoyer la chaîne vide si la valeur absolue dezest supérieure àZ_CRIT, sinon renvoyer"not "
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
# Assign current and prior year's median home value to variables
x1 = int(philly[philly["year"] == ____]["median_home_value"])
x2 = int(____)
# Calculate standard error as 90% MOE / critical Z score
se_x1 = float(____)
se_x2 = float(____)
# Calculate two-sample z-statistic, output message if greater than critical Z score
z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
print(msg.format(year, ____, year - 1))