1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu bằng SQL

Connected

Bài tập

Nhóm và mã hóa lại giá trị

Có gần 150 giá trị khác nhau của evanston311.category. Nhưng một số hạng mục có dạng tương tự "Main Category - Details". Nếu gộp theo hạng mục chính, bạn sẽ nhìn rõ hơn những loại yêu cầu phổ biến.

Để làm điều này, hãy tạo bảng tạm recode ánh xạ các giá trị category khác nhau sang các giá trị standardized mới. Đặt standardized là phần đứng trước dấu gạch ngang ('-') trong category. Trích xuất giá trị này bằng hàm split_part():

split_part(string text, delimiter text, field int)

Bạn cũng sẽ cần dọn dẹp bổ sung cho một vài trường hợp không theo mẫu này.

Sau đó có thể JOIN bảng evanston311 với recode để nhóm các yêu cầu theo giá trị hạng mục standardized mới.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tạo recode với cột standardized; dùng split_part() và sau đó rtrim() để loại bỏ khoảng trắng còn lại trên kết quả của split_part().