LoslegenKostenlos loslegen

Dask Bags filtern

Die Daten zu Politikerinnen und Politikern, mit denen du arbeitest, stammen aus verschiedenen Quellen und sind daher nicht besonders sauber. In vielen Dictionaries fehlen Schlüssel, die du für deine Analyse brauchst. Du musst die Elemente mit wichtigen fehlenden Schlüsseln herausfiltern.

Eine Funktion namens has_birth_date() ist in der Umgebung verfügbar. Sie prüft, ob das Eingabe-Dictionary den Schlüssel 'birth_date' enthält. Sie gibt True zurück, wenn der Schlüssel vorhanden ist, und False, wenn nicht.

def has_birth_date(dictionary):
  return 'birth_date' in dictionary

Der Bag, den du in der letzten Übung erstellt hast, ist in deiner Umgebung als dict_bag verfügbar.

Diese Übung ist Teil des Kurses

Parallele Programmierung mit Dask in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die .count()-Methode von dict_bag, um die Anzahl der enthaltenen Elemente auszugeben.
  • Verwende die Funktion has_birth_date(), um die Elemente herauszufiltern, die den Schlüssel 'birth_date' nicht haben.
  • Gib die Anzahl der Elemente aus, die filtered_bag enthält.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print the number of elements in dict_bag
print(____)

# Filter out records using the has_birth_date() function
filtered_bag = dict_bag.____(____)

# Print the number of elements in filtered_bag
print(____)
Code bearbeiten und ausführen