ComenzarEmpieza gratis

Reestructurar un diccionario

Ahora quieres limpiar los datos de los políticos y pasarlos a un DataFrame de Dask. Sin embargo, los datos de los políticos están anidados, así que tendrás que procesarlos un poco más antes de que encajen en un DataFrame.

Un dato concreto que quieres extraer está enterrado a varias capas dentro del diccionario. Se trata del enlace a una página web para cada político. El ejemplo siguiente muestra cómo está almacenado en el diccionario.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Stored here
...
}

La bolsa con los datos de los políticos está disponible en tu entorno como dict_bag.

Este ejercicio forma parte del curso

Programación paralela con Dask en Python

Ver curso

Instrucciones del ejercicio

  • Completa la función extract_url() para extraer la clave 'url' del diccionario, que está en la posición cero de la lista bajo la clave 'links', y asigna este valor a la clave url.
  • Ejecuta la función extract_url() en todos los elementos de la bolsa.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def extract_url(x):
    # Extract the url and assign it to the key 'url'
    x['url'] = x[____][____][____]
    return x
  
# Run the function on all elements in the bag.
dict_bag = ____

print(dict_bag.take(1))
Editar y ejecutar código