Reestructurar un diccionario
Ahora quieres limpiar los datos de los políticos y pasarlos a un DataFrame de Dask. Sin embargo, los datos de los políticos están anidados, así que tendrás que procesarlos un poco más antes de que encajen en un DataFrame.
Un dato concreto que quieres extraer está enterrado a varias capas dentro del diccionario. Se trata del enlace a una página web para cada político. El ejemplo siguiente muestra cómo está almacenado en el diccionario.
record = {
...
'links': [{'note': '...',
'url': '...'},], # Stored here
...
}
La bolsa con los datos de los políticos está disponible en tu entorno como dict_bag.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Completa la función
extract_url()para extraer la clave'url'del diccionario, que está en la posición cero de la lista bajo la clave'links', y asigna este valor a la claveurl. - Ejecuta la función
extract_url()en todos los elementos de la bolsa.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract_url(x):
# Extract the url and assign it to the key 'url'
x['url'] = x[____][____][____]
return x
# Run the function on all elements in the bag.
dict_bag = ____
print(dict_bag.take(1))