Calculando D para um estado
Neste exercício, você vai calcular o Índice de Dessemelhança para o estado da Geórgia. Lembre-se de que a fórmula do Índice de Dessemelhança é:
$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$
Neste caso, o Grupo A será de brancos, e o Grupo B será de negros. \(a\) e \(b\) representam as populações branca e negra da geografia menor (tracts), enquanto \(A\) e \(B\) representam as populações branca e negra da geografia maior que contém a primeira (Geórgia, código postal = GA, código FIPS = 13).
pandas foi importado com o alias usual, e o DataFrame tracts com as colunas de população "white" e "black" já foi carregado.
Este exercício faz parte do curso
Analisando dados do Censo dos EUA em Python
Instruções do exercício
- Crie o novo DataFrame
ga_tractscontendo apenas os tracts na Geórgia (a coluna"state"deve ser igual ao código FIPS"13") - Forneça os nomes das colunas em uma lista (use as variáveis
web) para imprimir a soma de brancos não hispânicos e negros na Geórgia - Pegue a população branca de cada tract dividida pela soma da população branca e subtraia a população negra de cada tract dividida pela soma da população negra; use as variáveis
webpara melhorar a legibilidade do código
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define convenience variables to hold column names
w = "white"
b = "black"
# Extract Georgia tracts
ga_tracts = tracts[____]
# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())
# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
____ / ____ - ____ / ____))
print("Dissimilarity (Georgia):", round(D, 3))