ComeçarComece de graça

Reestruturando um dicionário

Agora você quer limpar os dados dos políticos e movê-los para um Dask DataFrame. No entanto, os dados estão aninhados, então será preciso processá-los mais um pouco antes de caberem em um DataFrame.

Um dado específico que você quer extrair está enterrado algumas camadas dentro do dicionário. É o link para o site de cada político. O exemplo abaixo mostra como ele está armazenado dentro do dicionário.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Stored here
...
}

O bag com os dados dos políticos está disponível no seu ambiente como dict_bag.

Este exercício faz parte do curso

Programação Paralela com Dask em Python

Ver curso

Instruções do exercício

  • Complete a função extract_url() para extrair a chave 'url' do dicionário, que está na posição zero da lista sob a chave 'links', e atribua isso à chave url.
  • Execute a função extract_url() em todos os elementos do bag.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

def extract_url(x):
    # Extract the url and assign it to the key 'url'
    x['url'] = x[____][____][____]
    return x
  
# Run the function on all elements in the bag.
dict_bag = ____

print(dict_bag.take(1))
Editar e executar o código