1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

JSON データを読み込む

多くのオープンデータポータルでは、特にパースしやすい JSON 形式のデータセットが提供されています。URL から直接アクセスでき、各オブジェクトが1件のレコードに相当し、すべてのオブジェクトは同じ属性集合を持ち、値の中にさらにパースが必要な入れ子のオブジェクトが含まれていません。

New York City Department of Homeless Services の Daily Report はそのようなデータセットで、ホームレス収容施設の入所者数を長年にわたって含んでいます。pandas の read_json() 関数でデータフレームに読み込む前に、まずコンソールで中身を確認してみましょう。

指示

100 XP
  • コンソールに出力されている dhs_daily_report.json の内容をざっと確認しましょう。
  • pandas を pd として読み込みます。
  • read_json() を使って dhs_daily_report.json をデータフレーム pop_in_shelters に読み込みます。
  • データフレームの describe() メソッドで、pop_in_shelters の要約統計量を表示します。