Mendefinisikan skema
Mari mulai dengan mendefinisikan skema yang diharapkan untuk validasi data. Ini adalah langkah penting untuk memastikan kualitas data di seluruh pipeline ETL.
Anda akan menggunakan pustaka pointblank untuk mendefinisikan struktur skema.
Himpunan data telah dimuat untuk Anda sebagai ts.
Latihan ini adalah bagian dari kursus
Merancang Pipeline Peramalan untuk Produksi
Petunjuk latihan
- Mulailah dengan mengimpor
pointblank. - Definisikan skema menggunakan metode yang tepat.
- Atur kolom
respondentke tipeobjectdan kolomvalueke tipefloat64.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the required library
import ____ as ____
# Define the schema and set columns
table_schema = pb.____(
columns=[
("period", "datetime64[ns]"),
("respondent", "____"),
("respondent-name", "object"),
("type", "object"),
("type-name", "object"),
("value", "____"),
("value-units", "object")])
print(table_schema)