MulaiMulai sekarang secara gratis

Signifikansi Perbedaan Proporsi

Komuter sepeda masih belum umum, tetapi Washington, DC, memiliki porsi yang cukup baik. Angkanya meningkat lebih dari 1 poin persentase dalam beberapa tahun terakhir, tetapi apakah ini peningkatan yang signifikan secara statistik? Dalam latihan ini Anda akan menghitung galat baku dari suatu proporsi, lalu statistik Z dua sampel atas proporsi.

Rumus untuk galat baku (SE) suatu proporsi adalah:

$$SE_P = \frac{1}{N}\sqrt{SE_n^2 - P^2SE_N^2}$$

Rumus untuk statistik Z dua sampel adalah:

$$Z = \frac{x_1 - x_2}{\sqrt{SE_{x_1}^2 + SE_{x_2}^2}}$$

DataFrame dc sudah dimuat. DataFrame ini memiliki kolom (ditampilkan di konsol) dengan taksiran (berakhiran "_est") dan margin of error (berakhiran "_moe") untuk total pekerja dan komuter sepeda.

Fungsi sqrt telah diimpor dari modul numpy.

Latihan ini adalah bagian dari kursus

Menganalisis Data Sensus AS dengan Python

Lihat Kursus

Petunjuk latihan

  • Hitung bike_share dengan membagi jumlah pesepeda dengan total jumlah pekerja
  • Hitung SE dari taksiran pesepeda dan total pekerja, dengan membagi MOE dengan Z_CRIT
  • Hitung SE dari proporsi: se_bike adalah SE subpopulasi \(SE_n\), bike_share adalah proporsi \(P\), dan se_total adalah SE populasi \(SE_N\)
  • Hitung \(Z\): \(x_1\) dan \(x_2\) adalah bike_share pada 2017 dan 2011; \(SE_{x_1}\) dan \(SE_{x_2}\) adalah se_p pada 2017 dan 2011

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set the critical Z score for 90% confidence
Z_CRIT = 1.645

# Calculate share of bike commuting
dc["bike_share"] = ____

# Calculate standard errors of the estimate from MOEs
dc["se_bike"] = ____
dc["se_total"] = ____
dc["se_p"] = sqrt(____**2 - ____**2 * ____**2)**0.5 / dc["total_est"]

# Calculate the two sample statistic between 2011 and 2017
Z = (dc[dc["year"] == 2017]["bike_share"] - ____) / \
    sqrt(____**2 + ____**2)
print(Z_CRIT < Z)
Edit dan Jalankan Kode