1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Data Quality với Great Expectations

Connected

Bài tập

Thiết lập các Expectation cho chuỗi

Trong bài tập này, bạn sẽ luyện thiết lập và kiểm định một số Expectation dành cho kiểu chuỗi, bao gồm cả Expectation về khả năng phân tích cú pháp (parseability). Tương tự bài trước, hãy cân nhắc kỹ các Expectation bạn tạo và liệu chúng có phù hợp với dữ liệu hay không.

Một Batch đã được kết nối với bộ dữ liệu Shein Footwear và gán vào biến batch. Great Expectations và pandas lần lượt có sẵn dưới tên gx và pd.

Hướng dẫn 1/4

undefined XP
  • 1
    • In ra vài hàng đầu của DataFrame để gợi nhớ dữ liệu.
  • 2
    • Tạo một Expectation rằng độ dài của mỗi giá trị trong cột "name" bằng 100 ký tự.
    • Kiểm định (validate) Expectation của bạn.
  • 3
    • Tạo một Expectation rằng mỗi giá trị của cột "name" khớp với mẫu RegEx đã cung cấp.
    • Kiểm định Expectation của bạn.
  • 4
    • Tạo một Expectation rằng các giá trị của cột "name" có thể được phân tích cú pháp (parseable) bằng dateutil.
    • Kiểm định Expectation của bạn.