Definir el esquema
Empecemos definiendo el esquema esperado para la validación de datos. Este paso es clave para garantizar la calidad de los datos a lo largo de la canalización ETL.
Usarás la biblioteca pointblank para definir la estructura del esquema.
El conjunto de datos ya se ha cargado como ts.
Este ejercicio forma parte del curso
Diseño de canalizaciones de predicción para producción
Instrucciones del ejercicio
- Empieza importando
pointblank. - Define el esquema usando el método adecuado.
- Establece la columna
respondentcon tipoobjecty la columnavaluecon tipofloat64.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the required library
import ____ as ____
# Define the schema and set columns
table_schema = pb.____(
columns=[
("period", "datetime64[ns]"),
("respondent", "____"),
("respondent-name", "object"),
("type", "object"),
("type-name", "object"),
("value", "____"),
("value-units", "object")])
print(table_schema)