MulaiMulai sekarang secara gratis

Mengonversi ke DataFrame

Anda ingin membuat sebuah DataFrame dari data JSON politisi. Sekarang setelah Anda menormalkan struktur (de-nested) data, yang perlu dilakukan hanyalah memilih kunci yang akan dipertahankan sebagai kolom dalam DataFrame.

Dask bag yang Anda buat pada latihan sebelumnya tersedia di lingkungan Anda sebagai dict_bag.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Lengkapi fungsi select_keys() sehingga kunci dalam daftar keys_to_keep ditambahkan ke kamus tersaring yang baru dan dikembalikan.
  • Gunakan fungsi select_keys() untuk memilih kunci ['gender','name', 'birth_date', 'url'] dari dict_bag.
  • Konversikan bag yang telah difilter menjadi Dask DataFrame.
  • Cetak beberapa baris pertama dari DataFrame.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def select_keys(dictionary, keys_to_keep):
  new_dict = {}
  # Loop through kept keys and add them to new dictionary
  for k in ____:
    ____
  return new_dict

# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)

# Convert the restructured bag to a DataFrame
df = filtered_bag.____

# Print the first few rows of the DataFrame
print(____)
Edit dan Jalankan Kode