LoslegenKostenlos starten

Snapshot-Problem

Ein Teammitglied hat für ein Datenmodell Snapshots in dbt implementiert und sieht nicht für alle Zeilen die erwarteten Änderungen. Folgende Informationen liegen vor:

  • Die Daten für dieses Modell werden stündlich aktualisiert, wobei sich zu jeder vollen Stunde unterschiedliche Zeilen ändern.
  • Ungefähr 500.000 Zeilen werden pro Stunde hinzugefügt oder aktualisiert.
  • Der Batch-Prozess wird innerhalb des erwarteten stündlichen Zeitfensters abgeschlossen.
  • Der Snapshot-Prozess ist so automatisiert, dass er alle 24 Stunden läuft.
  • Innerhalb von 24 Stunden können dieselben Zeilen mehrfach geändert werden.

Was ist die wahrscheinlichste Lösung für dieses Problem?

Diese Übung ist Teil des Kurses

<Kurs>dbt für Forgeschrittene</Kurs>
Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten