Signifikansi Perbedaan Estimasi
Plot garis dengan batang galat memberi gambaran kasar tentang tren, tetapi apakah perbedaan dari tahun ke tahun signifikan secara statistik? Pada latihan ini, Anda akan menentukan signifikansi perubahan median harga rumah di Philadelphia. Anda akan mengevaluasi perbedaan dari tahun ke tahun antara 2011 dan 2017.
Rumus untuk statistik Z dua sampel adalah:
$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$
Sebuah DataFrame philly tersedia dengan kolom median_home_value, median_home_value_moe, dan year.
pandas telah diimpor sebagai pd, dan fungsi sqrt telah diimpor dari modul numpy.
Latihan ini adalah bagian dari kursus
Menganalisis Data Sensus AS dengan Python
Petunjuk latihan
- Setel
x1ke median nilai rumah tahun berjalan, danx2ke median nilai rumah untuk tahun sebelumnya (tahun berjalan dikurangi 1) - Setel
se_x1ke MOE median nilai rumah tahun berjalan yang dibagi denganZ_CRIT, danse_x2ke perhitungan yang sama untuk tahun sebelumnya - Gunakan operator ternary Python (
result1 if condition else result2) untuk mengembalikan string kosong jika nilai absolutzlebih besar daripadaZ_CRIT, dan selain itu kembalikan `"not "
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the critical Z score for 90% confidence, prepare message
Z_CRIT = 1.645
msg = "Philadelphia median home values in {} were {}significantly different from {}."
for year in range(2012, 2018):
# Assign current and prior year's median home value to variables
x1 = int(philly[philly["year"] == ____]["median_home_value"])
x2 = int(____)
# Calculate standard error as 90% MOE / critical Z score
se_x1 = float(____)
se_x2 = float(____)
# Calculate two-sample z-statistic, output message if greater than critical Z score
z = (x1 - x2) / sqrt(se_x1**2 + se_x2**2)
print(msg.format(year, ____, year - 1))