ComeçarComece de graça

Calculando D para um estado

Neste exercício, você vai calcular o Índice de Dessemelhança para o estado da Geórgia. Lembre-se de que a fórmula do Índice de Dessemelhança é:

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

Neste caso, o Grupo A será de brancos, e o Grupo B será de negros. \(a\) e \(b\) representam as populações branca e negra da geografia menor (tracts), enquanto \(A\) e \(B\) representam as populações branca e negra da geografia maior que contém a primeira (Geórgia, código postal = GA, código FIPS = 13).

pandas foi importado com o alias usual, e o DataFrame tracts com as colunas de população "white" e "black" já foi carregado.

Este exercício faz parte do curso

Analisando dados do Censo dos EUA em Python

Ver curso

Instruções do exercício

  • Crie o novo DataFrame ga_tracts contendo apenas os tracts na Geórgia (a coluna "state" deve ser igual ao código FIPS "13")
  • Forneça os nomes das colunas em uma lista (use as variáveis w e b) para imprimir a soma de brancos não hispânicos e negros na Geórgia
  • Pegue a população branca de cada tract dividida pela soma da população branca e subtraia a população negra de cada tract dividida pela soma da população negra; use as variáveis w e b para melhorar a legibilidade do código

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define convenience variables to hold column names
w = "white"
b = "black"

# Extract Georgia tracts
ga_tracts = tracts[____]

# Print sums of Black and White residents of Georgia
print(ga_tracts[____].sum())

# Calculate Index of Dissimilarity and print rounded result
D = 0.5 * sum(abs(
  ____ / ____ - ____ / ____))

print("Dissimilarity (Georgia):", round(D, 3))    
Editar e executar o código