1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong cơ sở dữ liệu PostgreSQL

Connected

Bài tập

Áp dụng hàm để làm sạch chuỗi

Xuyên suốt khóa học, bạn sẽ sử dụng một tập dữ liệu gồm 5000 bản ghi vi phạm đỗ xe ở New York City được lưu trong bảng parking_violation.

Một dịch vụ cung cấp bản in giấy vi phạm cho người nhận đang được thiết kế lại. Để định dạng đúng phần thông tin trên báo cáo, một số trường cần thay đổi so với cách biểu diễn trong cơ sở dữ liệu. Cụ thể:

  • Để canh lề văn bản đúng trên biểu mẫu, giá trị violation_location phải có độ dài 4 ký tự.
  • Tất cả giá trị P-U (pick-up truck) trong cột vehicle_body_type nên được thay bằng giá trị chung TRK.
  • Chỉ chữ cái đầu tiên của mỗi từ trong cột street_name được viết hoa.

Các hàm LPAD(), REPLACE() và INITCAP() sẽ được dùng để thực hiện các thay đổi này.

Hướng dẫn

100 XP
  • Thêm '0' vào đầu bất kỳ violation_location nào có độ dài ít hơn 4 chữ số bằng hàm LPAD().
  • Thay 'P-U' bằng 'TRK' trong các giá trị của cột vehicle_body_type bằng hàm REPLACE().
  • Đảm bảo chỉ chữ cái đầu của mỗi từ trong cột street_name được viết hoa bằng hàm INITCAP().