Gehostete Dateien laden
Dein Data-Engineering-Team bei Sierra Publishing hat verschiedene Funktionen von Databricks für seine Data-Engineering-Pipelines untersucht. Eine deiner Data Engineers hat dir folgendes Problem geschildert:
Momentan lese ich mehrere CSV-Dateien von einem externen Data-Lake-Speicherort ein. Es ist wirklich schwierig, meine Tabellen korrekt zu halten, weil ich nie weiß, wann neue Dateien eintreffen, und ich mir nicht leicht merken kann, welche Dateien ich bereits in meine Tabellen geladen habe.
Du möchtest integrierte Databricks-Funktionalität nutzen, um dieses Problem zu lösen. Welche der folgenden Optionen würde helfen?
Diese Übung ist Teil des Kurses
Databricks-Konzepte
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten