LoslegenKostenlos starten

Ein Dictionary umstrukturieren

Jetzt möchtest du die Politiker-Daten bereinigen und in ein Dask-DataFrame überführen. Da die Daten verschachtelt sind, musst du sie noch weiter verarbeiten, bevor sie in ein DataFrame passen.

Ein bestimmtes Datenelement, das du extrahieren möchtest, liegt ein paar Ebenen tief im Dictionary. Dabei handelt es sich um einen Link zu einer Website für jede Person. Das folgende Beispiel zeigt, wie dieser Wert im Dictionary gespeichert ist.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Stored here
...
}

Der Bag mit den Politiker-Daten steht dir in deiner Umgebung als dict_bag zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Parallele Programmierung mit Dask in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Vervollständige die Funktion extract_url(), um den Schlüssel 'url' aus dem Dictionary zu extrahieren, der an Position 0 der Liste unter dem Schlüssel 'links' liegt, und weise ihn dem Schlüssel url zu.
  • Führe die Funktion extract_url() über alle Elemente des Bags aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def extract_url(x):
    # Extract the url and assign it to the key 'url'
    x['url'] = x[____][____][____]
    return x
  
# Run the function on all elements in the bag.
dict_bag = ____

print(dict_bag.take(1))
Code bearbeiten und ausführen