Mendefinisikan skema
Mari mulai dengan mendefinisikan skema yang diharapkan untuk validasi data. Ini adalah langkah penting untuk memastikan kualitas data di seluruh pipeline ETL.
Anda akan menggunakan pustaka pointblank untuk mendefinisikan struktur skema.
Himpunan data telah dimuat untuk Anda sebagai ts.
Latihan ini merupakan bagian dari kursus
Merancang Pipeline Peramalan untuk Produksi
Instruksi latihan
- Mulailah dengan mengimpor
pointblank. - Definisikan skema menggunakan metode yang tepat.
- Atur kolom
respondentke tipeobjectdan kolomvalueke tipefloat64.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import the required library
import ____ as ____
# Define the schema and set columns
table_schema = pb.____(
columns=[
("period", "datetime64[ns]"),
("respondent", "____"),
("respondent-name", "object"),
("type", "object"),
("type-name", "object"),
("value", "____"),
("value-units", "object")])
print(table_schema)