IniziaInizia gratis

Definire lo schema

Iniziamo definendo lo schema atteso per la validazione dei dati. Questo è un passaggio fondamentale per garantire la qualità dei dati lungo tutta la pipeline ETL.

Userai la libreria pointblank per definire la struttura dello schema.

Il dataset è già stato caricato per te come ts.

Questo esercizio fa parte del corso

Progettare pipeline di forecasting per la produzione

Visualizza il corso

Istruzioni dell'esercizio

  • Inizia importando pointblank.
  • Definisci lo schema usando il metodo corretto.
  • Imposta la colonna respondent al tipo object e la colonna value al tipo float64.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the required library
import ____ as ____

# Define the schema and set columns
table_schema =  pb.____(
    columns=[
        ("period", "datetime64[ns]"),   
        ("respondent", "____"),
        ("respondent-name", "object"),
        ("type", "object"),
        ("type-name", "object"),
        ("value", "____"),
        ("value-units", "object")])

print(table_schema)
Modifica ed esegui il codice