IniziaInizia gratis

Ristrutturare un dizionario

Ora vuoi ripulire i dati sui politici e spostarli in un DataFrame Dask. Tuttavia, i dati sono annidati, quindi dovrai elaborarli ancora un po' prima che possano entrare in un DataFrame.

Un'informazione specifica che vuoi estrarre è sepolta a qualche livello all'interno del dizionario. Si tratta di un link a un sito web per ciascun politico. L'esempio seguente mostra come è memorizzato nel dizionario.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Stored here
...
}

Il bag con i dati sui politici è disponibile nel tuo ambiente come dict_bag.

Questo esercizio fa parte del corso

Programmazione parallela con Dask in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Completa la funzione extract_url() per estrarre la chiave 'url' dal dizionario, che si trova in posizione zero nella lista sotto la chiave 'links', e assegnala alla chiave url.
  • Esegui la funzione extract_url() su tutti gli elementi del bag.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def extract_url(x):
    # Extract the url and assign it to the key 'url'
    x['url'] = x[____][____][____]
    return x
  
# Run the function on all elements in the bag.
dict_bag = ____

print(dict_bag.take(1))
Modifica ed esegui il codice