In ein DataFrame umwandeln
Du möchtest aus den JSON-Daten der Politiker:innen ein DataFrame erstellen. Nachdem du die Daten entnestet hast, musst du nur noch die Keys auswählen, die als Spalten im DataFrame behalten werden sollen.
Der Dask Bag, den du in der letzten Übung erstellt hast, steht dir in deiner Umgebung als dict_bag zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>Parallele Programmierung mit Dask in Python</Kurs>Übungsanweisungen
- Vervollständige die Funktion
select_keys(), sodass die Keys in der Listekeys_to_keepdem neuen, gefilterten Dictionary hinzugefügt und zurückgegeben werden. - Verwende die Funktion
select_keys(), um die Keys['gender','name', 'birth_date', 'url']ausdict_bagauszuwählen. - Wandle den gefilterten Bag in ein Dask DataFrame um.
- Gib die ersten Zeilen des DataFrames aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def select_keys(dictionary, keys_to_keep):
new_dict = {}
# Loop through kept keys and add them to new dictionary
for k in ____:
____
return new_dict
# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)
# Convert the restructured bag to a DataFrame
df = filtered_bag.____
# Print the first few rows of the DataFrame
print(____)