Gehostete Dateien laden

Dein Data-Engineering-Team bei Sierra Publishing hat verschiedene Funktionen von Databricks für seine Data-Engineering-Pipelines untersucht. Eine deiner Data Engineers hat dir folgendes Problem geschildert:

Momentan lese ich mehrere CSV-Dateien von einem externen Data-Lake-Speicherort ein. Es ist wirklich schwierig, meine Tabellen korrekt zu halten, weil ich nie weiß, wann neue Dateien eintreffen, und ich mir nicht leicht merken kann, welche Dateien ich bereits in meine Tabellen geladen habe.

Du möchtest integrierte Databricks-Funktionalität nutzen, um dieses Problem zu lösen. Welche der folgenden Optionen würde helfen?

Diese Übung ist Teil des Kurses

<Kurs>Databricks-Konzepte</Kurs>

Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten