1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Bài tập

Vi phạm đỗ xe trùng lặp

Có một số khiếu nại cho thấy một số cư dân New York nhận nhiều vé phạt đỗ xe cho cùng một lần vi phạm. Điều này khiến những người bị ảnh hưởng phải chịu thêm phí pháp lý cho cùng một sự việc. Sự bức xúc về tình trạng này là có cơ sở. Bạn được giao nhiệm vụ xác định các bản ghi phản ánh việc trùng lặp vi phạm này.

Trong bài tập này, dùng ROW_NUMBER() để tìm các bản ghi parking_violation có cùng plate_id, issue_date, violation_time, house_number và street_name, cho thấy có nhiều vé được lập cho cùng một vi phạm.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Dùng ROW_NUMBER() với các cột plate_id, issue_date, violation_time, house_number và street_name để xác định cửa sổ trùng lặp.
  • Trừ 1 từ giá trị do ROW_NUMBER() trả về để tạo cột duplicate.