MulaiMulai sekarang secara gratis

Film bertingkat (nested)

Anda penasaran dengan himpunan data movies yang sudah lama ada di komputer Anda dan berisi data tentang berbagai film. Anda ingin menganalisis data tersebut, tetapi Anda menyadari formatnya adalah JSON bersarang (nested).

Untuk membacanya ke dalam DataFrame, Anda perlu menggunakan fungsi yang baru saja Anda pelajari. Setelah itu, Anda akan mengubah bentuk DataFrame yang dihasilkan agar lebih mudah digunakan.

JSON semi-terstruktur bernama movies tersedia untuk Anda. Pastikan untuk memeriksanya di konsol!

Latihan ini adalah bagian dari kursus

Mengubah Bentuk Data dengan pandas

Lihat Kursus

Petunjuk latihan

  • Impor fungsi json_normalize() dari pandas.
  • Normalkan JSON yang terdapat dalam movies. Pisahkan nama yang dihasilkan dari rekaman bersarang dengan garis bawah.
  • Ubah bentuk DataFrame movies_norm yang dihasilkan dari format lebar ke format panjang, dengan menggunakan kolom director dan producer sebagai indeks unik. Beri nama variabel baru yang dibuat dari kolom movies mulai dengan features, dipisahkan oleh garis bawah dengan sufiks yang berisi kata-kata.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the json_normalize function
____

# Normalize movies and separate the new columns with an underscore 
movies_norm = ____(____, sep=____)

# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____, 
                      i=____, j=____, 
                      sep=____, suffix=____)

# Print movies_long
print(movies_long)
Edit dan Jalankan Kode