In ein DataFrame umwandeln
Du möchtest aus den JSON-Daten der Politiker:innen ein DataFrame erstellen. Nachdem du die Daten entnestet hast, musst du nur noch die Keys auswählen, die als Spalten im DataFrame behalten werden sollen.
Der Dask Bag, den du in der letzten Übung erstellt hast, steht dir in deiner Umgebung als dict_bag zur Verfügung.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Vervollständige die Funktion
select_keys(), sodass die Keys in der Listekeys_to_keepdem neuen, gefilterten Dictionary hinzugefügt und zurückgegeben werden. - Verwende die Funktion
select_keys(), um die Keys['gender','name', 'birth_date', 'url']ausdict_bagauszuwählen. - Wandle den gefilterten Bag in ein Dask DataFrame um.
- Gib die ersten Zeilen des DataFrames aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def select_keys(dictionary, keys_to_keep):
new_dict = {}
# Loop through kept keys and add them to new dictionary
for k in ____:
____
return new_dict
# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)
# Convert the restructured bag to a DataFrame
df = filtered_bag.____
# Print the first few rows of the DataFrame
print(____)