1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Phân tích dữ liệu Điều tra Dân số Hoa Kỳ bằng Python

Connected

Bài tập

Tính D cho một bang

Trong bài này, bạn sẽ tính Chỉ số Khác biệt (Index of Dissimilarity) cho bang Georgia. Nhớ rằng công thức của Chỉ số Khác biệt là:

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

Trong trường hợp này, Nhóm A là người da trắng (Whites), Nhóm B là người da đen (Blacks). \(a\) và \(b\) lần lượt là dân số da trắng và da đen ở đơn vị địa lý nhỏ (các tract), còn \(A\) và \(B\) là dân số da trắng và da đen ở đơn vị địa lý lớn hơn bao trùm (Georgia, mã bưu chính = GA, mã FIPS = 13).

pandas đã được import với bí danh quen thuộc, và DataFrame tracts với các cột dân số "white" và "black" đã được nạp.

Hướng dẫn

100 XP
  • Tạo DataFrame mới ga_tracts chỉ chứa các tract thuộc Georgia (cột "state" phải bằng mã FIPS "13")
  • Cung cấp tên cột trong một danh sách (dùng các biến w và b) để in tổng số người da trắng không phải gốc Hispanic và người da đen ở Georgia
  • Lấy dân số da trắng của mỗi tract chia cho tổng dân số da trắng, rồi trừ đi dân số da đen của mỗi tract chia cho tổng dân số da đen; sử dụng các biến w và b để giúp mã dễ đọc hơn