Menangani data yang sangat bertingkat

Pada latihan sebelumnya, Anda meratakan data yang bertingkat satu level. Di sini, Anda akan membongkar data yang lebih dalam tingkatannya.

Atribut categories dalam respons API Yelp berisi daftar objek. Untuk meratakan data ini, Anda akan menggunakan argumen json_normalize() untuk menentukan jalur ke categories dan memilih atribut lain yang akan disertakan dalam dataframe. Anda juga harus mengubah pemisah agar memudahkan pemilihan kolom dan menambahkan prefiks pada atribut lain guna mencegah tabrakan nama kolom. Kita akan mengerjakannya selangkah demi selangkah.

pandas (sebagai pd) dan json_normalize() telah diimpor. Data Yelp berformat JSON tentang kafe di NYC disimpan sebagai data.

Latihan ini merupakan bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Flatten businesses records and set underscore separators
flat_cafes = ____(data["businesses"],
                  ____)

# View the data
print(flat_cafes.head())

Edit dan Jalankan Kode