Snapshot-Problem
Ein Teammitglied hat für ein Datenmodell Snapshots in dbt implementiert und sieht nicht für alle Zeilen die erwarteten Änderungen. Folgende Informationen liegen vor:
- Die Daten für dieses Modell werden stündlich aktualisiert, wobei sich zu jeder vollen Stunde unterschiedliche Zeilen ändern.
- Ungefähr 500.000 Zeilen werden pro Stunde hinzugefügt oder aktualisiert.
- Der Batch-Prozess wird innerhalb des erwarteten stündlichen Zeitfensters abgeschlossen.
- Der Snapshot-Prozess ist so automatisiert, dass er alle 24 Stunden läuft.
- Innerhalb von 24 Stunden können dieselben Zeilen mehrfach geändert werden.
Was ist die wahrscheinlichste Lösung für dieses Problem?
Diese Übung ist Teil des Kurses
<Kurs>dbt für Forgeschrittene</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten