Signifikanz von Differenzen in Schätzungen
Ein Liniendiagramm mit Fehlerbalken gibt dir einen groben Eindruck von Trends, aber sind die Unterschiede von Jahr zu Jahr statistisch signifikant? In dieser Übung bestimmst du die Signifikanz der Veränderung der Median-Hauspreise in Philadelphia. Du bewertest die Unterschiede von Jahr zu Jahr zwischen 2011 und 2017.
Die Formel für die Z-Statistik mit zwei Stichproben lautet:
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
Ein DataFrame philly ist verfügbar mit den Spalten median_home_value, median_home_value_moe und year.
pandas ist als pd importiert, und die Funktion sqrt wurde aus dem Modul numpy importiert.
Diese Übung ist Teil des Kurses
Analyse von US-Volkszählungsdaten mit Python
Anleitung zur Übung
- Setze
x1auf den Median-Hauswert des aktuellen Jahres undx2auf den Median-Hauswert des Vorjahres (aktuelles Jahr minus 1) - Setze
se_x1auf den MOE des Median-Hauswerts des aktuellen Jahres, geteilt durchZ_CRIT, undse_x2entsprechend für das Vorjahr - Verwende den ternären Operator in Python (
result1 if condition else result2), um den leeren String zurückzugeben, wenn der Absolutwert vonzgrößer alsZ_CRITist, und andernfalls"not "zurückzugeben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
# Assign current and prior year's median home value to variables
x1 = int(philly[philly["year"] == ____]["median_home_value"])
x2 = int(____)
# Calculate standard error as 90% MOE / critical Z score
se_x1 = float(____)
se_x2 = float(____)
# Calculate two-sample z-statistic, output message if greater than critical Z score
z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
print(msg.format(year, ____, year - 1))