Das Schema definieren

Beginnen wir damit, das erwartete Schema für die Datenvalidierung zu definieren. Das ist ein entscheidender Schritt, um die Datenqualität in der gesamten ETL-Pipeline sicherzustellen.

Du verwendest die Bibliothek pointblank, um die Schema-Struktur festzulegen.

Der Datensatz wurde bereits als ts für dich geladen.

Diese Übung ist Teil des Kurses

Forecasting-Pipelines für die Produktion entwerfen

Kurs anzeigen

Anleitung zur Übung

Importiere zuerst pointblank.
Definiere das Schema mit der passenden Methode.
Setze die Spalte respondent auf den Typ object und die Spalte value auf den Typ float64.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the required library
import ____ as ____

# Define the schema and set columns
table_schema =  pb.____(
    columns=[
        ("period", "datetime64[ns]"),   
        ("respondent", "____"),
        ("respondent-name", "object"),
        ("type", "object"),
        ("type-name", "object"),
        ("value", "____"),
        ("value-units", "object")])

print(table_schema)

Code bearbeiten und ausführen