Menghitung D untuk Satu Negara Bagian

Dalam latihan ini Anda akan menghitung Index of Dissimilarity untuk negara bagian Georgia. Ingat bahwa rumus Index of Dissimilarity adalah:

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

Dalam hal ini, Grup A adalah White, Grup B adalah Black. $a$ dan $b$ mewakili populasi White dan Black pada wilayah kecil (tract), sedangkan $A$ dan $B$ mewakili populasi White dan Black pada wilayah yang lebih besar yang menaunginya (Georgia, kode pos = GA, kode FIPS = 13).

pandas telah diimpor dengan alias biasa, dan DataFrame tracts dengan kolom populasi "white" dan "black" telah dimuat.

Latihan ini merupakan bagian dari kursus

Menganalisis Data Sensus AS dengan Python

Lihat Kursus

Instruksi latihan

Buat DataFrame baru ga_tracts yang hanya berisi tract di Georgia (kolom "state" harus sama dengan kode FIPS "13")
Sediakan nama kolom dalam sebuah list (gunakan variabel w dan b) untuk mencetak jumlah Nonhispanic White dan Black di Georgia
Ambil populasi White tiap tract dibagi dengan jumlah populasi White, lalu kurangkan dengan populasi Black tiap tract dibagi dengan jumlah populasi Black; gunakan variabel w dan b untuk meningkatkan keterbacaan kode

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Define convenience variables to hold column names
w = "white"
b = "black"

# Extract Georgia tracts
ga_tracts = tracts[____]

# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())

# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
  ____ / ____ - ____ / ____))

print("Dissimilarity (Georgia):", round(D, 3))

Edit dan Jalankan Kode