1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Bài tập

Khớp các tên màu không nhất quán

Từ mẫu bản ghi trong bảng parking_violation, có thể thấy các giá trị vehicle_color không nhất quán. Ví dụ, 'GRY', 'GRAY' và 'GREY' đều được dùng để mô tả màu xám của xe. Để biểu diễn màu này nhất quán, tốt nhất là chỉ dùng một giá trị. May mắn là bạn có thể dùng hàm DIFFERENCE() để đạt được mục tiêu này.

Trong bài tập này, bạn sẽ dùng DIFFERENCE() để trả về các bản ghi có giá trị vehicle_color gần khớp với chuỗi 'GRAY'. Mô-đun fuzzystrmatch đã được bật sẵn cho bạn.

Hướng dẫn

100 XP
  • Dùng hàm DIFFERENCE() để tìm các bản ghi trong parking_violation có vehicle_color với mã Soundex trùng với mã Soundex của 'GRAY'. Lưu ý rằng DIFFERENCE() nhận các giá trị chuỗi (không phải mã Soundex) làm đối số tham số.