Mengonversi ke DataFrame
Anda ingin membuat sebuah DataFrame dari data JSON politisi. Sekarang setelah Anda menormalkan struktur (de-nested) data, yang perlu dilakukan hanyalah memilih kunci yang akan dipertahankan sebagai kolom dalam DataFrame.
Dask bag yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda sebagai dict_bag.
Latihan ini adalah bagian dari kursus
Pemrograman Paralel dengan Dask di Python
Petunjuk latihan
- Lengkapi fungsi
select_keys()sehingga kunci dalam daftarkeys_to_keepditambahkan ke kamus tersaring yang baru dan dikembalikan. - Gunakan fungsi
select_keys()untuk memilih kunci['gender','name', 'birth_date', 'url']daridict_bag. - Konversikan bag yang telah difilter menjadi Dask DataFrame.
- Cetak beberapa baris pertama dari DataFrame.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def select_keys(dictionary, keys_to_keep):
new_dict = {}
# Loop through kept keys and add them to new dictionary
for k in ____:
____
return new_dict
# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)
# Convert the restructured bag to a DataFrame
df = filtered_bag.____
# Print the first few rows of the DataFrame
print(____)