ComenzarEmpieza gratis

Calcular D para un estado

En este ejercicio vas a calcular el Índice de Disimilitud para el estado de Georgia. Recuerda que la fórmula del Índice de Disimilitud es:

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

En este caso, el Grupo A será la población blanca y el Grupo B la población negra. \(a\) y \(b\) representan la población blanca y negra de la geografía pequeña (tractos), mientras que \(A\) y \(B\) representan la población blanca y negra de la geografía más grande que las contiene (Georgia, código postal = GA, código FIPS = 13).

pandas se ha importado con el alias habitual y el DataFrame tracts, con las columnas de población "white" y "black", ya está cargado.

Este ejercicio forma parte del curso

Análisis de datos del Censo de EE. UU. con Python

Ver curso

Instrucciones del ejercicio

  • Crea el nuevo DataFrame ga_tracts solo con los tractos de Georgia (la columna "state" debe ser igual al código FIPS "13").
  • Indica los nombres de las columnas en una lista (usa las variables w y b) para imprimir la suma de la población blanca no hispana y la población negra en Georgia.
  • Toma la población blanca de cada tracto dividida por la suma de la población blanca y réstale la población negra de cada tracto dividida por la suma de la población negra; usa las variables w y b para mejorar la legibilidad del código.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Define convenience variables to hold column names
w = "white"
b = "black"

# Extract Georgia tracts
ga_tracts = tracts[____]

# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())

# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
  ____ / ____ - ____ / ____))

print("Dissimilarity (Georgia):", round(D, 3))    
Editar y ejecutar código