Meratakan JSON bertingkat
Salah satu karakteristik data JSON adalah dapat bertingkat: nilai suatu atribut bisa terdiri atas pasangan atribut-nilai. Data bertingkat ini akan lebih bermanfaat jika dibuka, atau diratakan, menjadi kolom-kolom tersendiri dalam dataframe. Submodul pandas.io.json memiliki fungsi json_normalize() yang melakukan hal tersebut.
Data respons API Yelp bersifat bertingkat. Tugas Anda adalah meratakan level data berikutnya pada kolom coordinates dan location.
pandas (sebagai pd) dan requests sudah diimpor. Hasil pemanggilan API disimpan sebagai response.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Petunjuk latihan
- Muat fungsi
json_normalize()dari submodulio.jsonmilikpandas. - Pisahkan data JSON dari
responsedan tetapkan kedata. - Gunakan
json_normalize()untuk meratakan dan memuat data businesses ke dataframe,cafes. Atur argumensepagar menggunakan garis bawah (_), bukan titik. - Tampilkan head dari
data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load json_normalize()
____
# Isolate the JSON data from the API response
data = ____
# Flatten business data into a dataframe, replace separator
cafes = ____(data["businesses"],
____)
# View data
print(cafes.head())