1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Filtrowanie Dask bags

Dane o politykach, z którymi pracujesz, pochodzą z różnych źródeł, więc nie są zbyt uporządkowane. Wielu słownikom brakuje kluczy, które mogą być potrzebne podczas analizy. Konieczne będzie odfiltrowanie elementów z brakującymi istotnymi kluczami.

W środowisku dostępna jest funkcja has_birth_date(). Sprawdza ona, czy słownik wejściowy zawiera klucz 'birth_date'. Zwraca True, jeśli klucz istnieje, i False w przeciwnym razie.

def has_birth_date(dictionary):
  return 'birth_date' in dictionary

Bag utworzony w poprzednim ćwiczeniu jest dostępny w środowisku jako dict_bag.

Instrukcje

100 XP
  • Użyj metody .count() na dict_bag, aby wyświetlić liczbę zawartych w nim elementów.
  • Użyj funkcji has_birth_date(), aby odfiltrować elementy bez klucza 'birth_date'.
  • Wyświetl liczbę elementów zawartych w filtered_bag.