1. Învăţa
  2. /
  3. Courses
  4. /
  5. Thiết kế Pipeline Dự báo cho Môi trường Production

Connected

exercise

Thực hiện kiểm định dữ liệu

Giờ bạn đã định nghĩa xong schema, hãy tiến hành kiểm định dữ liệu. Trong bài tập này, bạn sẽ tạo các quy tắc kiểm định để đảm bảo chất lượng dữ liệu và kiểm tra các vấn đề thường gặp như trùng lặp và giá trị null.

table_schema từ bài tập trước đã được nạp sẵn cho bạn, cùng với DataFrame ts và thư viện pointblank.

Instrucţiuni

100 XP
  • Định nghĩa kiểm định bằng phương thức phù hợp và truyền vào DataFrame ts.
  • Thiết lập các quy tắc kiểm định với table_schema và kiểm tra trùng lặp.
  • In báo cáo kiểm định.