Een snapshot toevoegen
Wanneer je met je team samenwerkt, hoor je dat er een nieuwe gerelateerde gegevensset aan het datawarehouse wordt toegevoegd. Deze gegevensset bevat de voertuigen die gekoppeld zijn aan een bepaalde taxivergunning. Hoewel een taxi waarschijnlijk langere tijd in gebruik is, kan het zijn dat de vergunning in een bepaalde periode aan een nieuw voertuig wordt toegewezen. Een van je collega’s merkt op dat dit problemen kan geven bij toekomstige rapportages, omdat een rit dan mogelijk niet aan het juiste voertuig wordt gekoppeld.
De gegevensset ziet er als volgt uit:
| column_name | description |
|---|---|
| license_id | Het numerieke ID dat is toegewezen aan het taxibedrijf |
| vehicle_make | De fabrikant van het voertuig |
| vehicle_model | Het model van het voertuig |
| vehicle_year | Het jaar waarin het voertuig is geproduceerd |
| last_updated | Datum waarop het record voor het laatst is gewijzigd |
Als je dit bekijkt, realiseer je je dat dit een goed moment is om snapshots te implementeren met dbt. Na overleg met het team vraagt je teamlead je om de snapshotfunctionaliteit te implementeren in het project nyc_yellow_taxi, met gebruik van de source met de naam 'raw.vehicle_list'.
Deze oefening maakt deel uit van de cursus
Gevorderde dbt
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen