1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. Pythonで学ぶ米国センサスデータ分析

Connected

演習

1つの州でのDの計算

この演習では、ジョージア州の Dissimilarity 指数(偏離指数)を計算します。Dissimilarity 指数の式は次のとおりです。

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

ここでは、グループAがWhite(白人)、グループBがBlack(黒人)です。\(a\) と \(b\) は小地域(トラクト)の White と Black の人口、\(A\) と \(B\) はより大きな包含地域(ジョージア州、郵便略号 = GA、FIPS コード = 13)の White と Black の人口を表します。

pandas は通常のエイリアスでインポート済みで、人口列 "white" と "black" を持つ tracts DataFrame が読み込まれています。

指示

100 XP
  • ジョージア州のみのトラクトからなる新しい DataFrame ga_tracts を作成します("state" 列が FIPS コード "13" と等しい行)。
  • 列名をリストで指定し(変数 w と b を使用)、ジョージア州の Nonhispanic White と Black の合計を出力します。
  • 各トラクトの White 人口を White 人口合計で割った値から、各トラクトの Black 人口を Black 人口合計で割った値を引きます。コードの可読性を高めるために w と b の変数を使ってください。