Das Schema definieren
Beginnen wir damit, das erwartete Schema für die Datenvalidierung zu definieren. Das ist ein entscheidender Schritt, um die Datenqualität in der gesamten ETL-Pipeline sicherzustellen.
Du verwendest die Bibliothek pointblank, um die Schema-Struktur festzulegen.
Der Datensatz wurde bereits als ts für dich geladen.
Diese Übung ist Teil des Kurses
Forecasting-Pipelines für die Produktion entwerfen
Anleitung zur Übung
- Importiere zuerst
pointblank. - Definiere das Schema mit der passenden Methode.
- Setze die Spalte
respondentauf den Typobjectund die Spaltevalueauf den Typfloat64.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the required library
import ____ as ____
# Define the schema and set columns
table_schema = pb.____(
columns=[
("period", "datetime64[ns]"),
("respondent", "____"),
("respondent-name", "object"),
("type", "object"),
("type-name", "object"),
("value", "____"),
("value-units", "object")])
print(table_schema)