MulaiMulai sekarang secara gratis

Mendefinisikan skema

Mari mulai dengan mendefinisikan skema yang diharapkan untuk validasi data. Ini adalah langkah penting untuk memastikan kualitas data di seluruh pipeline ETL.

Anda akan menggunakan pustaka pointblank untuk mendefinisikan struktur skema.

Himpunan data telah dimuat untuk Anda sebagai ts.

Latihan ini adalah bagian dari kursus

Merancang Pipeline Peramalan untuk Produksi

Lihat Kursus

Petunjuk latihan

  • Mulailah dengan mengimpor pointblank.
  • Definisikan skema menggunakan metode yang tepat.
  • Atur kolom respondent ke tipe object dan kolom value ke tipe float64.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the required library
import ____ as ____

# Define the schema and set columns
table_schema =  pb.____(
    columns=[
        ("period", "datetime64[ns]"),   
        ("respondent", "____"),
        ("respondent-name", "object"),
        ("type", "object"),
        ("type-name", "object"),
        ("value", "____"),
        ("value-units", "object")])

print(table_schema)
Edit dan Jalankan Kode