LoslegenKostenlos loslegen

Das Schema definieren

Beginnen wir damit, das erwartete Schema für die Datenvalidierung zu definieren. Das ist ein entscheidender Schritt, um die Datenqualität in der gesamten ETL-Pipeline sicherzustellen.

Du verwendest die Bibliothek pointblank, um die Schema-Struktur festzulegen.

Der Datensatz wurde bereits als ts für dich geladen.

Diese Übung ist Teil des Kurses

Forecasting-Pipelines für die Produktion entwerfen

Kurs anzeigen

Anleitung zur Übung

  • Importiere zuerst pointblank.
  • Definiere das Schema mit der passenden Methode.
  • Setze die Spalte respondent auf den Typ object und die Spalte value auf den Typ float64.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the required library
import ____ as ____

# Define the schema and set columns
table_schema =  pb.____(
    columns=[
        ("period", "datetime64[ns]"),   
        ("respondent", "____"),
        ("respondent-name", "object"),
        ("type", "object"),
        ("type-name", "object"),
        ("value", "____"),
        ("value-units", "object")])

print(table_schema)
Code bearbeiten und ausführen