1. Learn
  2. /
  3. Courses
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Exercise

Xử lý bản ghi trùng lặp không đầy đủ

Bộ dữ liệu parking_violation đã được chỉnh sửa để bổ sung cột fee thể hiện mức phí cho mỗi vi phạm. Cột này hữu ích để theo dõi doanh thu vé phạt đỗ xe của New York City. Tuy nhiên, do có các bản ghi vi phạm trùng lặp, mọi phép tính doanh thu dựa trên bộ dữ liệu sẽ không chính xác. Các bản ghi trùng lặp này chỉ khác nhau ở giá trị trong cột fee. Tất cả các cột khác đều giống nhau giữa các bản ghi trùng lặp. Quyết định được đưa ra là dùng giá trị fee nhỏ nhất để xử lý sự mơ hồ do các bản trùng lặp gây ra.

Hãy xác định 3 bản ghi parking_violation bị trùng và dùng hàm MIN() để tìm fee sẽ được sử dụng sau khi loại bỏ các bản ghi trùng lặp.

Instructions

100 XP
  • Trả về summons_number và fee nhỏ nhất cho các bản ghi trùng lặp.
  • Gom nhóm kết quả theo summons_number.
  • Giới hạn kết quả ở những bản ghi có số lần xuất hiện (count) của summons_number lớn hơn 1.