LoslegenKostenlos loslegen

Snapshot-Problem

Ein Teammitglied hat für ein bestimmtes Datenmodell Snapshots in dbt implementiert und sieht nicht die erwarteten Änderungen für alle Zeilen. Es liefert folgende Informationen:

  • Die Daten für dieses Modell werden stündlich aktualisiert, wobei sich zu jeder vollen Stunde unterschiedliche Zeilen ändern.
  • Ungefähr 500.000 Zeilen werden pro Stunde hinzugefügt oder aktualisiert.
  • Der Batch-Prozess wird innerhalb des erwarteten stündlichen Zeitfensters abgeschlossen.
  • Der Snapshot-Prozess ist so automatisiert, dass er alle 24 Stunden läuft.
  • Innerhalb von 24 Stunden können mehrere Änderungen an denselben Zeilen auftreten.

Was ist die wahrscheinlichste Lösung für dieses Problem?

Diese Übung ist Teil des Kurses

Fortgeschrittenes dbt

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten