D für einen Bundesstaat berechnen

In dieser Übung berechnest du den Index der Ungleichheit (Index of Dissimilarity) für den Bundesstaat Georgia. Denk daran, dass die Formel für den Index der Ungleichheit lautet:

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

In diesem Fall ist Gruppe A die weiße Bevölkerung (Whites), Gruppe B die schwarze Bevölkerung (Blacks). $a$ und $b$ stehen für die weiße bzw. schwarze Bevölkerung der kleinen Geographie (Tracts), während $A$ und $B$ die weiße bzw. schwarze Bevölkerung der größeren, übergeordneten Geographie darstellen (Georgia, Postabkürzung = GA, FIPS-Code = 13).

pandas wurde mit dem üblichen Alias importiert, und das DataFrame tracts mit den Bevölkerungsspalten "white" und "black" wurde geladen.

Diese Übung ist Teil des Kurses

Analyse von US-Volkszählungsdaten mit Python

Kurs anzeigen

Anleitung zur Übung

Erstelle das neue DataFrame ga_tracts nur mit den Tracts in Georgia (die Spalte "state" soll dem FIPS-Code "13" entsprechen)
Gib die Spaltennamen in einer Liste an (verwende die Variablen w und b), um die Summe der nicht-hispanischen weißen und schwarzen Bevölkerung in Georgia auszugeben
Teile die weiße Bevölkerung jedes Tracts durch die Summe der weißen Bevölkerung und ziehe davon die schwarze Bevölkerung jedes Tracts geteilt durch die Summe der schwarzen Bevölkerung ab; verwende die Variablen w und b, um die Lesbarkeit des Codes zu verbessern

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define convenience variables to hold column names
w = "white"
b = "black"

# Extract Georgia tracts
ga_tracts = tracts[____]

# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())

# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
  ____ / ____ - ____ / ____))

print("Dissimilarity (Georgia):", round(D, 3))

Code bearbeiten und ausführen