1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

演習

辞書の再構成

政治家データをクリーンアップして、Dask DataFrame に移したいと考えています。ただし、この政治家データは入れ子構造になっているため、DataFrame に収まる形にするには、もう少し前処理が必要です。

取り出したいデータのひとつは、辞書のかなり深い層に埋もれています。各政治家のウェブサイトへのリンクです。以下の例は、そのリンクが辞書内にどのように格納されているかを示しています。

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # ここに格納されています
...
}

政治家データの bag は、環境内で dict_bag として利用できます。

指示

100 XP
  • extract_url() 関数を完成させ、'links' キーの下にあるリストの0番目の要素に含まれる辞書から 'url' キーを取り出し、これをキー url に代入します。
  • extract_url() 関数を bag のすべての要素に対して実行します。