Menghitung D untuk Satu Negara Bagian
Dalam latihan ini Anda akan menghitung Index of Dissimilarity untuk negara bagian Georgia. Ingat bahwa rumus Index of Dissimilarity adalah:
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
Dalam hal ini, Grup A adalah White, Grup B adalah Black. \(a\) dan \(b\) mewakili populasi White dan Black pada wilayah kecil (tract), sedangkan \(A\) dan \(B\) mewakili populasi White dan Black pada wilayah yang lebih besar yang menaunginya (Georgia, kode pos = GA, kode FIPS = 13).
pandas telah diimpor dengan alias biasa, dan DataFrame tracts dengan kolom populasi "white" dan "black" telah dimuat.
Latihan ini adalah bagian dari kursus
Menganalisis Data Sensus AS dengan Python
Petunjuk latihan
- Buat DataFrame baru
ga_tractsyang hanya berisi tract di Georgia (kolom"state"harus sama dengan kode FIPS"13") - Sediakan nama kolom dalam sebuah list (gunakan variabel
wdanb) untuk mencetak jumlah Nonhispanic White dan Black di Georgia - Ambil populasi White tiap tract dibagi dengan jumlah populasi White, lalu kurangkan dengan populasi Black tiap tract dibagi dengan jumlah populasi Black; gunakan variabel
wdanbuntuk meningkatkan keterbacaan kode
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))