1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Bài tập

Chuẩn hóa tên màu

Trong bài tập trước, hàm DIFFERENCE() được dùng để xác định các màu gần khớp với cách biểu diễn mong muốn của màu GRAY. Tuy nhiên, cách làm này giữ lại một số bản ghi mà giá trị vehicle_color có thể là xám hoặc không. Cụ thể, chuỗi GR (green) có cùng mã Soundex với chuỗi GRAY. May mắn là các bản ghi có các giá trị vehicle_color này có thể bị loại khỏi tập bản ghi cần thay đổi.

Trong bài tập này, bạn sẽ gán một giá trị vehicle_color màu xám nhất quán bằng cách nhận diện các chuỗi tương tự đại diện cho cùng một màu. Một lần nữa, mô-đun fuzzystrmatch đã được cài đặt sẵn cho bạn.

Hướng dẫn

100 XP
  • Hoàn thiện mệnh đề SET để gán 'GRAY' làm vehicle_color cho các bản ghi có giá trị vehicle_color có mã Soundex trùng với mã Soundex của 'GRAY'.
  • Cập nhật mệnh đề WHERE của truy vấn con để các giá trị summons_number được trả về sẽ loại trừ các summons_number từ các bản ghi có giá trị vehicle_color là 'GR'.