1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDaskによる並列プログラミング

Connected

演習

Dask bag のフィルタリング

扱っている政治家データは複数のソースから来ており、あまりクリーンではありません。解析に必要なキーが欠けている辞書が多く含まれています。重要なキーが欠けている要素をフィルタで取り除く必要があります。

環境には has_birth_date() という関数が用意されています。入力の辞書に 'birth_date' キーが含まれるかを確認し、含まれていれば True、なければ False を返します。

def has_birth_date(dictionary):
  return 'birth_date' in dictionary

前の演習で作成した bag は、環境内で dict_bag として利用できます。

指示

100 XP
  • dict_bag の .count() メソッドを使って、含まれる要素数を表示してください。
  • has_birth_date() 関数を使って、'birth_date' キーを持たない要素をフィルタで除外してください。
  • filtered_bag に含まれる要素数を表示してください。