Stappen in een datapijplijn
Als lead Data Engineer bij Sierra Publishing zijn jij en je team van Data Engineers gevraagd om boekrecensiedata op te schonen tot een analytics-klare gegevensset voor je analisten en data scientists.
Omdat je dagelijks data ontvangt van verschillende uitgeefpartners, moet je een geautomatiseerde en betrouwbare datapijplijn maken voor je downstream-datagebruikers.
Deze oefening maakt deel uit van de cursus
Databricks-concepten
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen