1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

データフレームを結合する

前の演習では、Yelp によるニューヨーク市の人気カフェ上位100件のデータセットを作成しました。ここでは、そのデータに地域の人口統計データを結びつけ、どの地域が人口当たりで最も良いカフェが多いかを調べます。

このために、DataFrame の merge() メソッドで2つのデータセットを結合します。1つ目の crosswalk は、ZIPコードと Public Use Micro Data Sample Areas(PUMA、国勢調査区を集約したもので、NYC の近隣地域に大まかに対応)の対応表です。次に、各 PUMA の 2016 年の推定人口を含む pop_data を結合します。

pandas(pd)はインポート済みで、前の演習から cafes データフレームも読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3

質問

コンソールで cafes と crosswalk のデータフレームを確認しましょう。結合キーとして使うべき列はどれですか?

選択肢