1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giới thiệu về NoSQL

Connected

Bài tập

Xử lý dữ liệu tài liệu

Xuyên suốt chương này, bạn đã khám phá nhiều công cụ để làm việc với dữ liệu tài liệu bán cấu trúc trong Postgres. Ở bài tập cuối cùng này, bạn sẽ vận dụng tất cả các công cụ đó để tạo ra một tập dữ liệu sẵn sàng cho phân tích. Bạn sẽ làm việc với bảng nested_reviews, có dạng như bên dưới.

nested_reviews table, showing sample data.

Để bạn khởi động nhanh, pandas đã được nhập với bí danh pd, và một đối tượng kết nối đã được tạo, lưu trong biến db_engine. Chúc bạn may mắn!

Hướng dẫn

100 XP
  • Sử dụng toán tử #> để trả về trường lồng nhau branch từ đối tượng location trong cột review, dưới dạng JSON. Đặt bí danh là branch.
  • Truy vấn trường statement trong cột review bằng toán tử ->>, đặt bí danh kết quả là statement.
  • Lọc kết quả chỉ bao gồm các bản ghi có reviewer ở vị trí 'Australia', với sự hỗ trợ của hàm json_extract_path_text.