Calculer D pour un État
Dans cet exercice, vous allez calculer l’indice de dissimilarité pour l’État de Géorgie. Rappelez‑vous que la formule de l’indice de dissimilarité est :
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
Ici, le groupe A correspond aux Blancs, et le groupe B aux Noirs. \(a\) et \(b\) représentent les populations blanche et noire de la petite géographie (les « tracts »), tandis que \(A\) et \(B\) représentent les populations blanche et noire de la géographie englobante (la Géorgie, code postal = GA, code FIPS = 13).
pandas a été importé avec l’alias habituel, et le DataFrame tracts contenant les colonnes de population "white" et "black" a été chargé.
Cet exercice fait partie du cours
Analyzing US Census Data in Python
Instructions
- Créez le nouveau DataFrame
ga_tractsavec uniquement les tracts en Géorgie (la colonne"state"doit être égale au code FIPS"13"). - Indiquez les noms de colonnes dans une liste (utilisez les variables
wetb) pour afficher la somme des populations blanche non hispanique et noire en Géorgie. - Prenez la population blanche de chaque tract divisée par la somme de la population blanche, puis soustrayez la population noire de chaque tract divisée par la somme de la population noire ; utilisez les variables
wetbpour améliorer la lisibilité du code.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))