1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu bằng SQL

Connected

Bài tập

Tạo bảng với biến chỉ báo

Xác định xem các yêu cầu có mức ưu tiên trung bình và cao trong dữ liệu evanston311 có nhiều khả năng chứa thông tin liên hệ của người gửi yêu cầu hay không: địa chỉ email hoặc số điện thoại.

  • Email có chứa ký tự @.
  • Số điện thoại có mẫu gồm ba ký tự, dấu gạch ngang, ba ký tự, dấu gạch ngang, bốn ký tự. Ví dụ: 555-555-1212.

Dùng LIKE để khớp các mẫu này. Nhớ rằng % khớp với bất kỳ số lượng ký tự nào (kể cả 0), và _ khớp với đúng một ký tự. Bao mẫu trong % (tức là đặt trước và sau mẫu) cho phép bạn tìm mẫu đó bên trong đoạn văn bản khác.

Ví dụ, '%___.com%' sẽ cho phép bạn tìm tham chiếu đến một website với tên miền cấp cao '.com' và có ít nhất ba ký tự đứng trước.

Tạo và lưu các biến chỉ báo cho email và phone trong một bảng tạm. LIKE trả về True hoặc False, nhưng ép kiểu một giá trị boolean (True hoặc False) sang integer sẽ chuyển True thành 1 và False thành 0. Cách này giúp bạn dễ tổng hợp các giá trị hơn về sau.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tạo bảng tạm indicators từ evanston311 với ba cột: id, email và phone.

  • Dùng so sánh LIKE để phát hiện các mẫu email và phone xuất hiện trong description, và ép kết quả về kiểu số nguyên bằng CAST().

    • Chỉ báo phone của bạn nên kết hợp dấu gạch dưới _ và dấu gạch ngang - để biểu diễn định dạng số điện thoại 10 chữ số tiêu chuẩn.
    • Hãy nhớ bắt đầu và kết thúc các mẫu bằng % để có thể tìm mẫu nằm trong văn bản khác!