D für einen Bundesstaat berechnen
In dieser Übung berechnest du den Index der Ungleichheit (Index of Dissimilarity) für den Bundesstaat Georgia. Denk daran, dass die Formel für den Index der Ungleichheit lautet:
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
In diesem Fall ist Gruppe A die weiße Bevölkerung (Whites), Gruppe B die schwarze Bevölkerung (Blacks). \(a\) und \(b\) stehen für die weiße bzw. schwarze Bevölkerung der kleinen Geographie (Tracts), während \(A\) und \(B\) die weiße bzw. schwarze Bevölkerung der größeren, übergeordneten Geographie darstellen (Georgia, Postabkürzung = GA, FIPS-Code = 13).
pandas wurde mit dem üblichen Alias importiert, und das DataFrame tracts mit den Bevölkerungsspalten "white" und "black" wurde geladen.
Diese Übung ist Teil des Kurses
Analyse von US-Volkszählungsdaten mit Python
Anleitung zur Übung
- Erstelle das neue DataFrame
ga_tractsnur mit den Tracts in Georgia (die Spalte"state"soll dem FIPS-Code"13"entsprechen) - Gib die Spaltennamen in einer Liste an (verwende die Variablen
wundb), um die Summe der nicht-hispanischen weißen und schwarzen Bevölkerung in Georgia auszugeben - Teile die weiße Bevölkerung jedes Tracts durch die Summe der weißen Bevölkerung und ziehe davon die schwarze Bevölkerung jedes Tracts geteilt durch die Summe der schwarzen Bevölkerung ab; verwende die Variablen
wundb, um die Lesbarkeit des Codes zu verbessern
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))