Memanipulasi data dokumen
Sepanjang bab ini, Anda telah mempelajari berbagai alat untuk bekerja dengan data dokumen semi-terstruktur di Postgres. Pada latihan terakhir ini, Anda akan memanfaatkan semua alat tersebut untuk membuat himpunan data yang siap dianalisis. Anda akan bekerja dengan tabel nested_reviews, yang berbentuk seperti di bawah ini.

Untuk membantu Anda memulai, pandas telah diimpor sebagai pd, dan sebuah objek koneksi telah dibuat serta disimpan dalam variabel db_engine. Semoga sukses!
Latihan ini adalah bagian dari kursus
Pengantar NoSQL
Petunjuk latihan
- Gunakan operator
#>untuk mengembalikan field bertingkatbranchdari objeklocationpada kolomreview, sebagai JSON. Gunakan aliasbranch. - Kueri field
statementpada kolomreviewmenggunakan operator->>, dan beri alias hasilnya sebagaistatement. - Saring hasil agar hanya mencakup rekaman dengan lokasi
reviewerbernilai'Australia', dengan bantuan fungsijson_extract_path_text.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Extract fields from JSON, and filter by reviewer location
query = """
SELECT
review_id,
____ #> '{____, ____}' AS ____,
____ ->> '____' AS ____,
rating
FROM nested_reviews
WHERE ____(____, '____', '____') = 'Australia'
ORDER BY rating DESC;
"""
data = pd.read_sql(query, db_engine)
print(data)