Restrukturisasi dictionary
Sekarang Anda ingin membersihkan data politisi dan memindahkannya ke Dask DataFrame. Namun, data politisi bersifat bertingkat (nested), sehingga Anda perlu memprosesnya lagi sebelum cocok dimasukkan ke DataFrame.
Salah satu bagian data yang ingin Anda ekstrak tersembunyi beberapa lapis di dalam dictionary. Ini adalah tautan ke situs web untuk setiap politisi. Contoh di bawah menunjukkan bagaimana data tersebut disimpan di dalam dictionary.
record = {
...
'links': [{'note': '...',
'url': '...'},], # Disimpan di sini
...
}
Bag berisi data politisi tersedia di environment Anda sebagai dict_bag.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Lengkapi fungsi
extract_url()untuk mengekstrak kunci'url'dari dictionary, yang berada pada posisi ke-0 dalam list di bawah kunci'links', lalu tetapkan nilai tersebut ke kunciurl. - Jalankan fungsi
extract_url()pada semua elemen dalam bag.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def extract_url(x):
# Extract the url and assign it to the key 'url'
x['url'] = x[____][____][____]
return x
# Run the function on all elements in the bag.
dict_bag = ____
print(dict_bag.take(1))