D berekenen voor één staat
In deze oefening bereken je de Index of Dissimilarity voor de staat Georgia. Onthoud dat de formule voor de Index of Dissimilarity is:
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
In dit geval is Groep A White en Groep B Black. \(a\) en \(b\) staan voor de White- en Black-bevolking van de kleine geografie (tracts), terwijl \(A\) en \(B\) de White- en Black-bevolking voorstellen van de grotere, omvattende geografie (Georgia, postcode = GA, FIPS-code = 13).
pandas is geïmporteerd met de gebruikelijke alias en de DataFrame tracts met de kolommen "white" en "black" voor de bevolking is geladen.
Deze oefening maakt deel uit van de cursus
US Census-gegevens analyseren in Python
Oefeninstructies
- Maak de nieuwe DataFrame
ga_tractsmet alleen de tracts in Georgia (kolom"state"moet gelijk zijn aan FIPS-code"13") - Geef de kolomnamen in een lijst (gebruik de variabelen
wenb) om de som van Nonhispanic White en Black in Georgia af te drukken - Neem de White-bevolking van elk tract gedeeld door de som van de White-bevolking, en trek daar de Black-bevolking van elk tract gedeeld door de som van de Black-bevolking van af; gebruik de variabelen
wenbom de code leesbaarder te maken
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))