Menangani data yang sangat bertingkat
Pada latihan sebelumnya, Anda meratakan data yang bertingkat satu level. Di sini, Anda akan membongkar data yang lebih dalam tingkatannya.
Atribut categories dalam respons API Yelp berisi daftar objek. Untuk meratakan data ini, Anda akan menggunakan argumen json_normalize() untuk menentukan jalur ke categories dan memilih atribut lain yang akan disertakan dalam dataframe. Anda juga harus mengubah pemisah agar memudahkan pemilihan kolom dan menambahkan prefiks pada atribut lain guna mencegah tabrakan nama kolom. Kita akan mengerjakannya selangkah demi selangkah.
pandas (sebagai pd) dan json_normalize() telah diimpor. Data Yelp berformat JSON tentang kafe di NYC disimpan sebagai data.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
____)
# View the data
print(flat_cafes.head())