Dask Bags filtern
Die Daten zu Politikerinnen und Politikern, mit denen du arbeitest, stammen aus verschiedenen Quellen und sind daher nicht besonders sauber. In vielen Dictionaries fehlen Schlüssel, die du für deine Analyse brauchst. Du musst die Elemente mit wichtigen fehlenden Schlüsseln herausfiltern.
Eine Funktion namens has_birth_date() ist in der Umgebung verfügbar. Sie prüft, ob das Eingabe-Dictionary den Schlüssel 'birth_date' enthält. Sie gibt True zurück, wenn der Schlüssel vorhanden ist, und False, wenn nicht.
def has_birth_date(dictionary):
return 'birth_date' in dictionary
Der Bag, den du in der letzten Übung erstellt hast, ist in deiner Umgebung als dict_bag verfügbar.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Verwende die
.count()-Methode vondict_bag, um die Anzahl der enthaltenen Elemente auszugeben. - Verwende die Funktion
has_birth_date(), um die Elemente herauszufiltern, die den Schlüssel'birth_date'nicht haben. - Gib die Anzahl der Elemente aus, die
filtered_bagenthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the number of elements in dict_bag
print(____)
# Filter out records using the has_birth_date() function
filtered_bag = dict_bag.____(____)
# Print the number of elements in filtered_bag
print(____)