Film bertingkat (nested)
Anda penasaran dengan himpunan data movies yang sudah lama ada di komputer Anda dan berisi data tentang berbagai film. Anda ingin menganalisis data tersebut, tetapi Anda menyadari formatnya adalah JSON bersarang (nested).
Untuk membacanya ke dalam DataFrame, Anda perlu menggunakan fungsi yang baru saja Anda pelajari. Setelah itu, Anda akan mengubah bentuk DataFrame yang dihasilkan agar lebih mudah digunakan.
JSON semi-terstruktur bernama movies tersedia untuk Anda. Pastikan untuk memeriksanya di konsol!
Latihan ini adalah bagian dari kursus
Mengubah Bentuk Data dengan pandas
Petunjuk latihan
- Impor fungsi
json_normalize()daripandas. - Normalkan JSON yang terdapat dalam
movies. Pisahkan nama yang dihasilkan dari rekaman bersarang dengan garis bawah. - Ubah bentuk DataFrame
movies_normyang dihasilkan dari format lebar ke format panjang, dengan menggunakan kolomdirectordanproducersebagai indeks unik. Beri nama variabel baru yang dibuat dari kolommoviesmulai denganfeatures, dipisahkan oleh garis bawah dengan sufiks yang berisi kata-kata.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the json_normalize function
____
# Normalize movies and separate the new columns with an underscore
movies_norm = ____(____, sep=____)
# Reshape using director and producer as index, create movies from column starting from features
movies_long = pd.____(____, stubnames=____,
i=____, j=____,
sep=____, suffix=____)
# Print movies_long
print(movies_long)