Ristrutturare un dizionario
Ora vuoi ripulire i dati sui politici e spostarli in un DataFrame Dask. Tuttavia, i dati sono annidati, quindi dovrai elaborarli ancora un po' prima che possano entrare in un DataFrame.
Un'informazione specifica che vuoi estrarre è sepolta a qualche livello all'interno del dizionario. Si tratta di un link a un sito web per ciascun politico. L'esempio seguente mostra come è memorizzato nel dizionario.
record = {
...
'links': [{'note': '...',
'url': '...'},], # Stored here
...
}
Il bag con i dati sui politici è disponibile nel tuo ambiente come dict_bag.
Questo esercizio fa parte del corso
Programmazione parallela con Dask in Python
Istruzioni dell'esercizio
- Completa la funzione
extract_url()per estrarre la chiave'url'dal dizionario, che si trova in posizione zero nella lista sotto la chiave'links', e assegnala alla chiaveurl. - Esegui la funzione
extract_url()su tutti gli elementi del bag.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def extract_url(x):
# Extract the url and assign it to the key 'url'
x['url'] = x[____][____][____]
return x
# Run the function on all elements in the bag.
dict_bag = ____
print(dict_bag.take(1))