Calcular D para un estado
En este ejercicio vas a calcular el Índice de Disimilitud para el estado de Georgia. Recuerda que la fórmula del Índice de Disimilitud es:
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
En este caso, el Grupo A será la población blanca y el Grupo B la población negra. \(a\) y \(b\) representan la población blanca y negra de la geografía pequeña (tractos), mientras que \(A\) y \(B\) representan la población blanca y negra de la geografía más grande que las contiene (Georgia, código postal = GA, código FIPS = 13).
pandas se ha importado con el alias habitual y el DataFrame tracts, con las columnas de población "white" y "black", ya está cargado.
Este ejercicio forma parte del curso
Análisis de datos del Censo de EE. UU. con Python
Instrucciones del ejercicio
- Crea el nuevo DataFrame
ga_tractssolo con los tractos de Georgia (la columna"state"debe ser igual al código FIPS"13"). - Indica los nombres de las columnas en una lista (usa las variables
wyb) para imprimir la suma de la población blanca no hispana y la población negra en Georgia. - Toma la población blanca de cada tracto dividida por la suma de la población blanca y réstale la población negra de cada tracto dividida por la suma de la población negra; usa las variables
wybpara mejorar la legibilidad del código.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))