1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Bài tập

Tổng hợp hạng mục giấy phép quay phim

Ở bài tập cuối cùng của khóa học, hãy quay lại bảng film_permit. Bảng này có cột community_board kiểu TEXT, gồm danh sách các số nguyên được phân tách bằng dấu phẩy. Có nhu cầu phân tích các loại giấy phép quay phim đang được cấp cho từng community board. Tuy nhiên, cách biểu diễn community board (các INTEGER trong một cột TEXT) khiến việc này trở nên khó khăn. Bằng cách dùng các kỹ thuật bạn đã học trong chương này, dữ liệu có thể được biến đổi để phục vụ phân tích đó.

Trong bài tập này, trước tiên bạn sẽ tạo một VIEW (tạm thời) biểu diễn riêng lẻ các giá trị community_board cho hai hạng mục giấy phép. VIEW là một truy vấn có tên và sau khi tạo, có thể dùng như một TABLE. Bạn sẽ dùng VIEW này trong một truy vấn con để tổng hợp kết quả dưới dạng pivot table.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng REGEXP_SPLIT_TO_TABLE() để tách community_board thành nhiều hàng, với dấu phẩy (',') theo sau là khoảng trắng (' ') làm dấu phân tách 2 ký tự.
  • Giới hạn các giá trị của category ở 'Film', 'Television', và 'Documentary'.