Ein Dictionary umstrukturieren
Jetzt möchtest du die Politiker-Daten bereinigen und in ein Dask-DataFrame überführen. Da die Daten verschachtelt sind, musst du sie noch weiter verarbeiten, bevor sie in ein DataFrame passen.
Ein bestimmtes Datenelement, das du extrahieren möchtest, liegt ein paar Ebenen tief im Dictionary. Dabei handelt es sich um einen Link zu einer Website für jede Person. Das folgende Beispiel zeigt, wie dieser Wert im Dictionary gespeichert ist.
record = {
...
'links': [{'note': '...',
'url': '...'},], # Stored here
...
}
Der Bag mit den Politiker-Daten steht dir in deiner Umgebung als dict_bag zur Verfügung.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Vervollständige die Funktion
extract_url(), um den Schlüssel'url'aus dem Dictionary zu extrahieren, der an Position 0 der Liste unter dem Schlüssel'links'liegt, und weise ihn dem Schlüsselurlzu. - Führe die Funktion
extract_url()über alle Elemente des Bags aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def extract_url(x):
# Extract the url and assign it to the key 'url'
x['url'] = x[____][____][____]
return x
# Run the function on all elements in the bag.
dict_bag = ____
print(dict_bag.take(1))