Definire lo schema
Iniziamo definendo lo schema atteso per la validazione dei dati. Questo è un passaggio fondamentale per garantire la qualità dei dati lungo tutta la pipeline ETL.
Userai la libreria pointblank per definire la struttura dello schema.
Il dataset è già stato caricato per te come ts.
Questo esercizio fa parte del corso
Progettare pipeline di forecasting per la produzione
Istruzioni dell'esercizio
- Inizia importando
pointblank. - Definisci lo schema usando il metodo corretto.
- Imposta la colonna
respondental tipoobjecte la colonnavalueal tipofloat64.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the required library
import ____ as ____
# Define the schema and set columns
table_schema = pb.____(
columns=[
("period", "datetime64[ns]"),
("respondent", "____"),
("respondent-name", "object"),
("type", "object"),
("type-name", "object"),
("value", "____"),
("value-units", "object")])
print(table_schema)