MulaiMulai sekarang secara gratis

Meratakan JSON bertingkat

Salah satu karakteristik data JSON adalah dapat bertingkat: nilai suatu atribut bisa terdiri atas pasangan atribut-nilai. Data bertingkat ini akan lebih bermanfaat jika dibuka, atau diratakan, menjadi kolom-kolom tersendiri dalam dataframe. Submodul pandas.io.json memiliki fungsi json_normalize() yang melakukan hal tersebut.

Data respons API Yelp bersifat bertingkat. Tugas Anda adalah meratakan level data berikutnya pada kolom coordinates dan location.

pandas (sebagai pd) dan requests sudah diimpor. Hasil pemanggilan API disimpan sebagai response.

Latihan ini adalah bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Petunjuk latihan

  • Muat fungsi json_normalize() dari submodul io.json milik pandas.
  • Pisahkan data JSON dari response dan tetapkan ke data.
  • Gunakan json_normalize() untuk meratakan dan memuat data businesses ke dataframe, cafes. Atur argumen sep agar menggunakan garis bawah (_), bukan titik.
  • Tampilkan head dari data.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load json_normalize()
____

# Isolate the JSON data from the API response
data = ____

# Flatten business data into a dataframe, replace separator
cafes = ____(data["businesses"],
             ____)

# View data
print(cafes.head())
Edit dan Jalankan Kode