1. 学ぶ
  2. /
  3. コース
  4. /
  5. Thiết kế Pipeline Dự báo cho Môi trường Production

Connected

演習

Định nghĩa schema

Hãy bắt đầu bằng cách định nghĩa schema kỳ vọng cho việc kiểm định dữ liệu. Đây là bước quan trọng để đảm bảo chất lượng dữ liệu xuyên suốt pipeline ETL.

Bạn sẽ dùng thư viện pointblank để định nghĩa cấu trúc schema.

Bộ dữ liệu đã được nạp sẵn dưới biến ts.

指示

100 XP
  • Bắt đầu bằng cách import pointblank.
  • Định nghĩa schema bằng phương thức phù hợp.
  • Đặt cột respondent kiểu object và cột value kiểu float64.