1. 학습
  2. /
  3. 프로젝트
  4. /
  5. Pythonで学ぶ米国センサスデータ分析

Connected

연습 문제

トラクトと大都市圏の結合

merge メソッドの使い方に集中できるように、不平等指数(Index of Dissimilarity)を計算する関数は用意してあります。(次の演習でこの関数をご自身で作成します!)

この関数を適用するには、MSA 識別子を tracts DataFrame に追加する必要があります。結合キーとして、両方の DataFrame にある state と county を使います。最後に、seaborn の stripplot メソッドを使って、最も分離が大きい上位 10 の大都市圏を可視化します。

これまでに使用した tracts DataFrame が読み込まれています。MSA ごとの人口データは msa として読み込まれており、先頭数行がコンソールに表示されています。最後に、各 MSA を構成する郡の情報が入った msa_def も読み込まれています。

pandas と seaborn は通常のエイリアスで読み込まれています。

지침

100 XP
  • msa DataFrame に対して nlargest メソッドを使い、"population" に基づく上位 50 の大都市圏を取得します。
  • tracts と msa_def の両方には "state" と "county" 列があります。これらの列で結合するように、on パラメータを指定して merge メソッドを使います。
  • msa と msa_D を、MSA 識別子で merge メソッドにより結合します。