Reestruturando um dicionário
Agora você quer limpar os dados dos políticos e movê-los para um Dask DataFrame. No entanto, os dados estão aninhados, então será preciso processá-los mais um pouco antes de caberem em um DataFrame.
Um dado específico que você quer extrair está enterrado algumas camadas dentro do dicionário. É o link para o site de cada político. O exemplo abaixo mostra como ele está armazenado dentro do dicionário.
record = {
...
'links': [{'note': '...',
'url': '...'},], # Stored here
...
}
O bag com os dados dos políticos está disponível no seu ambiente como dict_bag.
Este exercício faz parte do curso
Programação Paralela com Dask em Python
Instruções do exercício
- Complete a função
extract_url()para extrair a chave'url'do dicionário, que está na posição zero da lista sob a chave'links', e atribua isso à chaveurl. - Execute a função
extract_url()em todos os elementos do bag.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract_url(x):
# Extract the url and assign it to the key 'url'
x['url'] = x[____][____][____]
return x
# Run the function on all elements in the bag.
dict_bag = ____
print(dict_bag.take(1))