ComenzarEmpieza gratis

Definir el esquema

Empecemos definiendo el esquema esperado para la validación de datos. Este paso es clave para garantizar la calidad de los datos a lo largo de la canalización ETL.

Usarás la biblioteca pointblank para definir la estructura del esquema.

El conjunto de datos ya se ha cargado como ts.

Este ejercicio forma parte del curso

Diseño de canalizaciones de predicción para producción

Ver curso

Instrucciones del ejercicio

  • Empieza importando pointblank.
  • Define el esquema usando el método adecuado.
  • Establece la columna respondent con tipo object y la columna value con tipo float64.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the required library
import ____ as ____

# Define the schema and set columns
table_schema =  pb.____(
    columns=[
        ("period", "datetime64[ns]"),   
        ("respondent", "____"),
        ("respondent-name", "object"),
        ("type", "object"),
        ("type-name", "object"),
        ("value", "____"),
        ("value-units", "object")])

print(table_schema)
Editar y ejecutar código