MulaiMulai sekarang secara gratis

Restrukturisasi dictionary

Sekarang Anda ingin membersihkan data politisi dan memindahkannya ke Dask DataFrame. Namun, data politisi bersifat bertingkat (nested), sehingga Anda perlu memprosesnya lagi sebelum cocok dimasukkan ke DataFrame.

Salah satu bagian data yang ingin Anda ekstrak tersembunyi beberapa lapis di dalam dictionary. Ini adalah tautan ke situs web untuk setiap politisi. Contoh di bawah menunjukkan bagaimana data tersebut disimpan di dalam dictionary.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Disimpan di sini
...
}

Bag berisi data politisi tersedia di environment Anda sebagai dict_bag.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Lengkapi fungsi extract_url() untuk mengekstrak kunci 'url' dari dictionary, yang berada pada posisi ke-0 dalam list di bawah kunci 'links', lalu tetapkan nilai tersebut ke kunci url.
  • Jalankan fungsi extract_url() pada semua elemen dalam bag.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def extract_url(x):
    # Extract the url and assign it to the key 'url'
    x['url'] = x[____][____][____]
    return x
  
# Run the function on all elements in the bag.
dict_bag = ____

print(dict_bag.take(1))
Edit dan Jalankan Kode