Calculer D pour un État

Dans cet exercice, vous allez calculer l’indice de dissimilarité pour l’État de Géorgie. Rappelez‑vous que la formule de l’indice de dissimilarité est :

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

Ici, le groupe A correspond aux Blancs, et le groupe B aux Noirs. $a$ et $b$ représentent les populations blanche et noire de la petite géographie (les « tracts »), tandis que $A$ et $B$ représentent les populations blanche et noire de la géographie englobante (la Géorgie, code postal = GA, code FIPS = 13).

pandas a été importé avec l’alias habituel, et le DataFrame tracts contenant les colonnes de population "white" et "black" a été chargé.

Cet exercice fait partie du cours

<cours>Analyzing US Census Data in Python</cours>

Voir le cours

Instructions de l’exercice

Créez le nouveau DataFrame ga_tracts avec uniquement les tracts en Géorgie (la colonne "state" doit être égale au code FIPS "13").
Indiquez les noms de colonnes dans une liste (utilisez les variables w et b) pour afficher la somme des populations blanche non hispanique et noire en Géorgie.
Prenez la population blanche de chaque tract divisée par la somme de la population blanche, puis soustrayez la population noire de chaque tract divisée par la somme de la population noire ; utilisez les variables w et b pour améliorer la lisibilité du code.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Define convenience variables to hold column names
w = "white"
b = "black"

# Extract Georgia tracts
ga_tracts = tracts[____]

# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())

# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
  ____ / ____ - ____ / ____))

print("Dissimilarity (Georgia):", round(D, 3))

Modifier et exécuter le code