Schritte der Datenpipeline
Als leitende:r Data Engineer bei Sierra Publishing sollst du gemeinsam mit deinem Team Buchrezensionsdaten so bereinigen, dass ein analytics‑fähiger Datensatz für eure Analyst:innen und Data Scientists entsteht.
Da du täglich Daten von verschiedenen Verlagspartnern erhältst, musst du eine automatisierte und verlässliche Datenpipeline für deine nachgelagerten Datenkonsument:innen aufbauen.
Diese Übung ist Teil des Kurses
Databricks-Konzepte
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten